{IF(user_region="ru/495"){ }} {IF(user_region="ru/499"){ }}


Иван Ямщиков AI-евангелист ABBYY 15 июня 2018г.
ABBYY. Применение AI в бизнесе
Компания ABBYY разрабатывает решения в области интеллектуальной обработки информации и лингвистики. Почему автоматизация нужна там, где появляется скука?

Дмитрий Завалишин:

Здравствуйте! В эфире «DZ Online» и наш сегодняшний гость, Иван Ямщиков AI-евангелист компании ABBYY. 

Иван Ямщиков:

Привет!

Дмитрий Завалишин:

У вас есть некоторый спектр инструментов на базе искусственного интеллекта, который, вообще говоря, вы продаёте. То есть есть, оказывается, люди, которым это почему-то надо, и это где-то вписывается в их модель нанесения пользы миру, в их бизнес, в их прямые бизнес процессы. Можем мы в этом месте сначала хотя бы показать спектр, куда это попадает вообще в мире?

Иван Ямщиков:

Да, конечно. Смотри, вообще, везде, где в мире есть документы, туда попадают продукты ABBYY в некотором виде. Потому что мы умеем, до сих пор есть огромное количество процедур, которые регуляторно устроены так, что они должны существовать на бумаге. 

Дмитрий Завалишин:

Именно на бумаге.

Иван Ямщиков:

В каком-то виде. 

Дмитрий Завалишин:

Логично. 

Иван Ямщиков:

Потом у нас следующая история, это любые вообще документы в электронном виде, с которыми тоже неизбежно у тебя будет документооборот, когда ты взаимодействуешь. Когда ты делаешь бизнес, тебе нужны документы. Неважно, как они устроены, неважно, на каком они носителе, это понятно, это следующий шаг, ты прав. Дальше у нас есть сейчас некоторое количество продуктов на основе искусственного интеллекта, которые делают аналитику поверх этого пайплайна. То есть вся эта история про то, что тебе просто нужно всё оцифровать и вытащить из него какие-то там Entity Recognition. Поняли, что этот договор заключён между вот этими двумя организациями или поняли, как открывать счёт юрлица в банке, например. Приходит юр.лицо, ему надо кучу бумажек заполнить, мы это можем делать автоматически, сильно ускоряя процесс. Или другой пример оптимизации бизнеса, это когда у тебя есть экспортная, импортная сделка, ну вообще, любая сделка в условиях недостаточного доверия. Мы можем делать на базе DLT Distributed ledger technologies, подписание контрактов, которые на порядок ускоряют время, допустим, на экспортную сделку. Но это, на самом деле низкоуровневая история, которая про то, чтобы смазывать шестерёнки бизнеса умными технологиями. А верхнеуровневая история, это хорошо, ребята, мы, когда всё это делаем, мы всё равно неизбежным образом умеем вытаскивать те или иные объекты, факты, взаимосвязи между ними, семантику за счёт антологии, которая у нас есть, за счет естественного языка, который мы умеем понимать. Но значит поверх этого можно делать какие-то аналитические решения. К примеру, у нас есть на российском рынке продукт мониторинга рисков на рынке, когда, к примеру, к тебе приходит юридическое лицо, а ты банк. Представь, что ты банк, и юридическое лицо говорит: дай мне кредит. 

Дмитрий Завалишин:

Скоринг. 

Иван Ямщиков:

Скоринг - это даже не столько скоринг, это скорее возможность, к примеру, перелопатить все решения всех мировых судов или просто судов в отношении этого объекта и как-то понять, что там вообще с ним происходило, какая у него история, что про него писали журналисты. И сделать это быстро и с довольно высоким уровнем полноты и точности. Ну и соответственно, это логичное, на самом деле, это логичная история, если ты подумаешь, как растёт по карьерной лестнице клерк в какой-то организации, это очень логичная история. Ты сначала ускоряешь перекладывание бумажек, потом ты начинаешь разбираться с тем, как разные бумажки устроены, понимаешь, как их классифицировать, понимаешь. Потом ты понимаешь, как организовать работу тех, кто работает с бумагами, потом ты начинаешь понимать, как из этой информации вынимать какие-то важные инсайты именно стратегического характера для своего бизнеса в целом. Но если коротко, вот это, мне кажется, довольно описание бизнес-приложения, бизнес продуктов. Продукты могут быть разные, они всегда заточены под клиента, потому что... 

Дмитрий Завалишин:

Но вы же коробочная компания, тем не менее. То есть у вас, как правило, продукт этот в виде некоторого решения, которые сделано осознанно, решает поднятую вами задачу, а клиент подпадает под него или не попадает. Вы не работаете в режиме... 

Иван Ямщиков:

Слушай, ну не совсем. Это сильно зависит от клиента, это сильно зависит от задачи. Если, условно говоря, мы понимаем, что у нас сейчас, допустим, нет такого решения, но мы понимаем, что его надо делать, мы все равно его будем делать, и мы сейчас можем найти хорошего партнёра, с которым мы можем вместе эту дорогу пройти, чтобы потом это продавать дальше. Мы всегда готовы к такого рода работе. 

Дмитрий Завалишин:

Где начинается размер вашего клиента, для которого вот эти ценности влияют ощутимо на эффективность бизнеса?

Иван Ямщиков:

Слушай, это сложный вопрос, потому что мы не лезем в бухгалтерию клиента, как ты понимаешь. 

Дмитрий Завалишин:

Я простых вопросов не собирался задавать. 

Иван Ямщиков:

Есть, на самом деле, общее, довольно понятное правило такое, правило буравчика, если угодно. Оно примерно устроенном следующим образом. Посмотрите свою пирамиду затрат, и посмотрите, какое количество этих ваших затрат приходится на монотонную работу в той или иной сфере. То есть, на самом деле, у Андрея Себранта есть прекрасная фраза, которую я люблю цитировать, что «если вашу работу можно автоматизировать, значит ее автоматизируют». 

Дмитрий Завалишин:

Рано или поздно. 

Иван Ямщиков:

Вот посмотрите, какой процент затрат ваших, это автоматизируемая, алгоритмизируемая процедура. 

Дмитрий Завалишин:

Это, кстати, я бы сейчас с ним немножко, жалко, его с нами нет сейчас. 

Иван Ямщиков:

Слушай, но ты можешь со мной поспорить, я согласен полностью. 

Дмитрий Завалишин:

Я бы с ним поспорил почему, потому что любая автоматизация, во-первых, любая автоматизация устроена всегда так, это закрываем 90 % автоматом, 10 делаем руками, это, во-первых, понятно. Во-вторых, каждый раз, когда мы автоматизируем, как это, старый анекдот ещё советских времён. Это машина для стрижки, но головы разные. Нет, это они разные только до первой стрижки. То есть любая автоматизация неизбежно превращает объект автоматизации в шар в вакууме. Она его упрощает всегда. 

Иван Ямщиков:

Подожди, давай я тебя прямо отобью по обоим пунктам. Первый пункт, ты 10 % делаешь руками, но это другие руки. 

Дмитрий Завалишин:

Конечно да. 

Иван Ямщиков:

Соответственно, это другое качество. 

Дмитрий Завалишин:

И другая ценность, и цена другая. 

Иван Ямщиков:

И шансы, что вдруг головы будут разными, возрастают. 

Дмитрий Завалишин:

Конечно, да. 

Иван Ямщиков:

Во-вторых, что касается второй части, что головы разные только до первой стрижки, при всём уважении нас есть закон. И закон очень часто требуют от головы очень чётких параметров. 

Дмитрий Завалишин:

Быть очень круглой.

Иван Ямщиков:

И соответственно, люди довольно плохо подгоняют голову под эти параметры, делают много ошибок, скучают, зевают, и в этом месте автоматизации, но она просто должна быть, она совершенно... 

Дмитрий Завалишин:

Когда закон и так приказал им иметь круглую голову, как раз поможем её..

Иван Ямщиков:

Что мы можем сделать? 

Дмитрий Завалишин:

Шкуркой обработать и превратить в это самое. 

Иван Ямщиков:

Совершенно верно.

Дмитрий Завалишин:

Очень часто звучит, неизбежно, когда мы говорим про AI, про семантику, звучит слово «понимать». Слово «понимать», которые относится к человеку, всем понятно, все его хорошо понимают. Когда мы говорим «AI понимает», все сразу ни черта не понимают. Что такое «AI понимает»?

Иван Ямщиков:

Во-первых, любой человек, который думает, что он понимает, что он что-то понимает, я предлагаю ему почитать... 

Дмитрий Завалишин:

Черт, ни черта не понимает. 

Иван Ямщиков:

Я ему предлагаю почитать Пелевина, любую книгу, с любого места. 

Дмитрий Завалишин:

Мы уже всех заморочили. 

Иван Ямщиков:

Виктор Олегович Пелевин, ум «Б» и вот это всё. Это во-первых. Теперь, если серьёзно. На самом деле, это большой вопрос, который сейчас стоит и перед исследовательскими коллективами, и перед индустрией. И люди под пониманием используют разные вещи, и мы в этом месте не договорились. Это, на мой взгляд, проблема, которая породила и психологию, и гуманитарные знания, и философия, machine learner в него уперлись, просто не ожидая. То есть мы думали, что всё уже придумано до нас, что мы сейчас возьмём определение. 

Дмитрий Завалишин:

Слово не определено, и вы, на самом деле, не знаете, что с ним делать.

Иван Ямщиков:

Оно не определено. 

Дмитрий Завалишин:

Но вы же его используете, тем не менее. В вашем маркетинге вы это слово используете. То есть вы что-то имеете в виду. 

Иван Ямщиков:

Теперь это третье, это просто третий класс, ответы на твой вопрос. Как используется словопонимание сейчас в индустрии. Но это, на самом деле, некоторый state of the art. State of the art, он заключается в следующем. Мы говорим про то, что если алгоритмически мы можем извлекать из информации более высокий уровень абстракции, чем некоторый base line, то мы говорим, что это лучшее понимание. Мы не говорим, что это абсолютное понимание, мы говорим, что мы понимаем лучше. То есть я понимаю, что-то лучше, чем ты, если я оттуда могу извлечь больше полезной информации относительно некоторой метрики. 

Дмитрий Завалишин:

То есть понимание, это мера объёма формализованной информации, которую получается извлечь. 

Иван Ямщиков:

Да, формализация метрики уже зависит от задач. Она зависит от задач, от заказчика и так далее. 

Дмитрий Завалишин:

Насколько я понимаю современный AI, вот именно в смысле семантического анализа, он в целом бьётся на 2 ветки, поправь меня, если я не прав. Одна, это отображение на некоторую антологию, мы говорим, у нас есть текст, если он про химию, он про физику, здесь он физику ядерную, а тут про...

Иван Ямщиков:

Скорее, когда мы говорим в бизнесе, это какой-то, я не знаю, контракт какой-то, платёжка, какая-то форма, инвойс и так далее или контракт между двумя организациями. 

Дмитрий Завалишин:

Это скорее во вторую часть, вторая, это то, что называется fact extraction. Тогда мы берём текст и говорим: слушайте, здесь кажется действует 2 актора, один из них это называется Завод металлургический такой-то, такой-то, а второй называется Прокуратура такого-то района. И те акторы, кажется, находятся в таком-то отношении, которое называется «вызвать на суд», например, наверное, происходит 5 числа такого-то года, то есть какая-то вокруг этого возникает фактическая обвязка. 

Иван Ямщиков:

Но мы сейчас говорим про понимание языка.

Дмитрий Завалишин:

Вот вы делаете и то, и другое или это связано между собой?

Иван Ямщиков:

Во-первых, мы делаем и то, и другое, и это, на мой взгляд, санитарный минимум, если вы заявляете, что вы умеете работать с естественным языком, вы должны делать и то, и другое. 

Дмитрий Завалишин:

Видимо, за этим что-то есть, потому что это делают, в общем-то, все. Или утверждают, что делают. 

Иван Ямщиков:

Смотрите, поэтому я говорю, что это санитарный минимум, без этого просто не надо вообще приходить на этот рынок. Дальше, на самом деле, я бы сказал то, о чём ты говоришь, там есть ещё некоторый третий вариант, это когда мы берём какую-то систему машинного обучения, неважно, это нейросетка или градиент, или что-то еще, неважно, какой-то алгоритм, мы его оптимизуем под некоторую интегральную метрику. То есть мы, на самом деле, не пытаемся достать низкоуровневое понимание на уровне по элементно, мы пытаемся сделать какой-то скоринг поверх текста. Это третий, на самом деле, тип задач, он не про антологию и не про fact extraction. 

Дмитрий Завалишин:

Скоринг текста, давай попробуем его формализовать. Это какая-то функция текста, которая... 

Иван Ямщиков:

К примеру, мы пытаемся оценить, хорошо отзываются о компании или плохо. 

Дмитрий Завалишин:

Такой самый банальный скоринг. 

Иван Ямщиков:

Самый простой, это сентимент-анализ. Мы пытаемся понять, хорошо или плохо отзываются о компании, или мы пытаемся оценить юридические риски того или иного документа. Мы пытаемся понять, соответствует ли этот документ некоторым регулятивным нормам и нам, на самом деле. В этом месте нужен просто порог, который, как ты правильно говоришь, 90 % точно мы уверены, что это или точно не соответствует... 

Дмитрий Завалишин:

А 10 % руками смотреть. 

Иван Ямщиков:

А 10 % смотреть руками, да. Это третий тип задачи. Теперь что касается того, что дальше. Дальше довольно много всего, потому что, во-первых, нужно иметь экспертизу и понимание того, какой метод ложится на какую бизнес задачу. И это, к сожалению или к счастью, очень плохо достаётся просто из научных статей и опен-сорсных продуктов, это нужно... 

Дмитрий Завалишин:

То есть не то, что пошёл скачать...

Иван Ямщиков:

В шестеренках крутился подолгу, не по долгу службы, а подолгу времени. То есть нужно уметь, просто нужно уметь работать с конкретными... 

Дмитрий Завалишин:

С инструментами. 

Иван Ямщиков:

Это первое, второе, это умение построения ансамбля моделей, когда тебе, на самом деле, нужно делать несколько вещей с документами, и тебе нужно сделать так.. У тебя есть несколько задач всегда у бизнеса, у тебя есть несколько вопросов, на которые ты должен отвечать. Если ты правильно умеешь комбинировать методы, ты можешь получать качественно на более высокие результаты. Если ты умеешь правильно собирать решение из разных кусков. 

Дмитрий Завалишин:

Если мы говорим про соответствие документа некоторой регуляторике, то это довольно серьёзная заявка. Это означает, что у вас есть на одной стороне какой-то парсинг вот этой самой регуляторики, какой-то нормативки, которая порождает внутри вашей системы условно формализованные или, я не знаю, как устроен, может быть, он устроен в виде какого-то нейронного непостижимого набора нейронов. Но, тем не менее, это знание вот об этой задаче. И дальше наложение этого знания на документ. Я правильно понимаю, как это устроено? 

Иван Ямщиков:

Ты описываешь такую, немножко вакуумную ситуацию. Если коротко, у тебя, на самом деле, это задача, в самом широком видео она формализуется не только на регулятивку, она просто так устроена. У тебя есть некоторые требования к допустимым параметрам документа, это не важно, что может быть, если это мы говорим об инвойсе или какой-то форме, то у нас есть, допустим, список полей, которые там должны быть. Это очень простое правило. При этом эти поля могут быть в разных местах, тогда нужно пробежаться по ней. 

Дмитрий Завалишин:

Это вопрос понимания, что является, как раз в этом смысле слово «понимание» приобретает некоторый понятный смысл. Понимание - это знание о том, что данный объект, это как раз отображение на антологию. 

Иван Ямщиков:

Да, совершенно верно. Потому что отображение, это одна из больших проблем машинного обучения в бизнесе, она в том, что ты приходишь к менеджеру и говоришь: мы сделали новый алгоритм и повысили качество на 5 %. Он говорит: а что он делает? А ты ему говоришь: он делает градиентный бустинг. Он говорит: это классно. 

Дмитрий Завалишин:

Спасибо, ребята. 

Иван Ямщиков:

Кто именно будет сидеть. То есть... 

Дмитрий Завалишин:

Отличный вопрос. 

Иван Ямщиков:

Низкая возможность интерпретировать решения, она подчас является стоппером для внедрения современных методов машинного обучения. Антология, она хорошо интерпретирует. 

Дмитрий Завалишин:

Она хорошо интерпретирует. Не знаю, слушатели поняли, я попытаюсь сейчас конвертировать то, что сказал в человеческий язык. То есть есть... 

Иван Ямщиков:

Приходи после этого в гости к вам. Говоришь, говоришь, а потом тебе... 

Дмитрий Завалишин:

Ну, сложно сказал. Есть ответ системы, который говорит: да, это закону соответствуют. После чего ты говоришь: ну-ка объясни, почему ты считаешь, что да. Детализация этого, причём отображаемая на понимании человека, она ценна сама по себе. В этом смысле. 

Иван Ямщиков:

Да, совершенно верно. 

Дмитрий Завалишин:

Чуть-чуть обратно вернёмся, всё-таки мы же говорим о том, как ты продаётся конечному клиенту. Прийти, клиенту сказать: смотри, вот есть система, которая берет твой контракт, читает его и отвечает тебе на вопрос, соответствует ли он законам Российской Федерации или нет, это отличный кейс. То есть есть масса людей, которые его понимают. Но его же надо продавать именно в таком формате. То есть продавать не систему, а сервис. Вы продаёте систему или сервис? Сервис включает в себя... 

Иван Ямщиков:

Я прямо вообще потерялся. 

Дмитрий Завалишин:

Система - это механизм, который ты взял, принёс к себе, включил, работает. Законы в него сам должен загружать. А сервис означает, что вы отвечаете за соответствие этого дела текущему нормативному набору актов. 

Иван Ямщиков:

Это всё зависит от клиента. Если говорить, допустим, про любой, на самом деле, продукт, это не обязательно какие-то юридические риски, это может быть просто история с парсингом чеков, или инвойсов, или чего-то ещё. Это зависит от клиента, иногда клиент хочет, чтобы это было сделано на его стороне, иногда он не хочет, это можно обсуждать. 

Дмитрий Завалишин:

Но, тем не менее, ваше ожидание в этом месте. Просто есть компании, которые говорят: купите у нас машинку, робота. 

Иван Ямщиков:

Но мы вообще готовы с клиентом работать. Мы не боимся работать с клиентом, не боимся приходить, предлагать решения. 

Дмитрий Завалишин:

Смотри, в таком формате, скажем, про 1С известно, что они продают не бухгалтерию, а, на самом деле, соответствие бухгалтерии законам РФ. Смысл сервиса, он там в основном находится. Покупают их не за то, что у них машинка работает и документы перетаскивает, это может сделать примерно кто угодно. А поддержать это дело на уровне текущей базы законодательной, гарантируя, что ты успеваешь всё вовремя, это некоторая ценность. 

Иван Ямщиков:

Что касается продукта с легальными рисками, то он, как я понимаю, сейчас у нас существует, не на российском рынке, а на американском, в первую очередь, и там всё немного сложнее. Там прецедентное право, там есть свои тонкости, связанные с тем, что нужна база этих самых прецедентов и так далее. 

Дмитрий Завалишин:

Но я правильно понимаю, что там вы продаёте его в формате поисковой системой. То есть это некоторый механизм, который тебе говорят в ответ на твой вопрос, где есть набор прецедентов, которые вот к этому соответствуют. Он не претендует на полноту и на точный ответ, что мы точно знаем, что прямо так. Мы тебе говорим, что мы сейчас поищем. 

Иван Ямщиков:

Любой скоринг, смотри, хороший скоринг не может тебе дать ответ 1 или 0. 

Дмитрий Завалишин:

Ну, конечно. 

Иван Ямщиков:

Дорогие друзья, если кто-то вам продал скоринг, который всегда говорит 1 или 0, идите к нам лучше, покупайте у нас, скоринг у нас лучше. Почему, потому что это, как: сержант, приборы! 20! Что 20? А что приборы? Соответственно, да, у тебя всегда есть некоторая оценка вероятности того или иного события, и у тебя, по-хорошему, есть ещё оценка точности предсказания. Ты должен выставлять пороги в этом месте, мы можем тебе посоветовать, сказать: слушай, если ты хочешь поставить порог на 0,5, то, наверное, с точностью плюс минус лапоть по карте, наверное, это плохая идея использования продукта, наша точность выше, порог надо ставить нестись. Но ты должен это делать сам, естественно. 

Дмитрий Завалишин:

У меня это бьются внезапно с тематикой медицинской, в которой тоже AI, естественно, прет со страшной силой. И там тоже возникает такой очевидный вопрос. Хорошо, ты пришёл к электронному доктору, он тебе сказал: нормально всё у тебя. Или: нет, у тебя болит вот это, вот это. А откуда вообще мы знаем, что всё нормально, и что вот именно это болит, а ещё что-то не болит. То есть степень достоверности того, что он тебе сказал, это вообще большой вопрос и как он говорит непонятно. В медицине в этом месте поступают очень просто. Они говорят: слушайте, это вообще second opinion, это просто инструмент верификации и дополнительного погружения в картину. Всегда есть настоящий, живой доктор, он всегда за это отвечает, но если вы сомневаетесь, чтобы помочь ему, чтобы он всё не перекапывал, и вдруг он ещё что-нибудь проглядит, то система посмотрит и даст ему ещё некоторое количество предметов для размышлений. Это похожая модель? 

Иван Ямщиков:

Слушай, я бы не сказал, что это похожая модель, потому что во многом... 

Дмитрий Завалишин:

То есть вы готовы без доктора в существенной степени?

Иван Ямщиков:

Нет, смотри, тут проблема главная с доктором, она в том, что, по крайней мере, в США это большие требования регуляторов. 

Дмитрий Завалишин:

Это везде так. 

Иван Ямщиков:

Очень много, где, допустим, с той же самой диагностикой рака по снимкам очень часто искусственный интеллект дает качество выше, чем консилиум специалистов. Но есть понятные интересы, American Medical Associacion и т.д. И поэтому тут всё очень сильно зависит от задач. И нужно понимать, что в случае с медициной, когда мы хотим second opinion, third opinion, forth opinion, цена вопроса - человеческая жизнь и, соответственно, это довольно разумная история про то, что мы хотим, она разумная с точки зрения... 

Дмитрий Завалишин:

Контракт можно тоже так неправильно оценить, что можно кого-нибудь, в конце концов угрожают.

Иван Ямщиков:

Хорошо, согласен, но в случае с медициной это прямо очень прямая связь между желанием, на самом деле, распределить ответственность за финальное решение с последствиями этого решения. В случае с определёнными бизнес кейсами очень часто есть просто некоторые допустимые пороги ошибок, когда клиент понимает, что сейчас у него люди руками разбирают инвойсы, ошибаются в N процентах случаев. Если мы берём K процентов случаев и это K ниже N, то клиент доволен, всё в порядке. Как это в старом анекдоте, что возьмём K танков, если K мало, возьмём N. То есть поскольку инвойс, это не человеческая жизнь почти всегда, скажем так, мы бы хотели жить в мире, в котором инвойс, это не человеческая жизнь. Соответственно, это работает и тут, опять же, возвращаюсь к тому вопросу, который мы обсудили ранее, у тебя всегда есть некоторая базовая точка отсчёта и метрика, на которой ты соревнуешься. Ну, не всегда, почти всегда хорошо поставленная задача, это задача, в который у тебя метрика есть. 

Дмитрий Завалишин:

То есть есть бизнес, он как-то уже работает, у него есть процесс, он чего-то стоит, мы знаем какой-то фактор, который позволяет его оценивать. 

Иван Ямщиков:

Да, и бизнесу становится более прозрачным наше ценообразование в этом месте, потому что бизнес понимает, как у него устроен процесс. 

Дмитрий Завалишин:

Оно становится для него в некотором смысле всё равно, потому что для него важно не сколько оно стоит, а как оно соотносится с изменением его затрат на этом бизнес процессе. 

Иван Ямщиков:

Совершенно верно. 

Дмитрий Завалишин:

И это такая тоже очень интересная модель, которая выносит за скобки саму стоимость, потому что вы тоже не можете стоимость вашего процесса соотнести с ценой результата. 

Иван Ямщиков:

Это часто бывает. 

Дмитрий Завалишин:

То есть вы же занимаетесь этим, по-моему, с девяностых. 

Иван Ямщиков:

89-й год, компания основана в 89-м году. 

Дмитрий Завалишин:

89-й вообще, это советское время ещё.

Иван Ямщиков:

Да. 

Дмитрий Завалишин:

И вообще говоря, посчитать объём затрат, которые понесли, чтобы всё это породить, уже, наверное, просто нереально, то есть цена космическая абсолютно. 

Иван Ямщиков:

Компания, во-первых, прибыльна, во-вторых, без внешнего капитала развивается. 

Дмитрий Завалишин:

Всё это время?

Иван Ямщиков:

Да. 

Дмитрий Завалишин:

Скажи, пожалуйста, вот смотри, ты сейчас называешь некоторую тематику, которая очень понятна. Прилетел инвойс, сидит девочка, разбирается, ошибается, прямо целая куча проблем, много народу понимает, что это тяжело. Но дальше понятно, что происходит. Сначала мы ушли бумаги в инвойсах, они стали электронными, вы всё ещё нужны, потому что всё равно их в Excel посылают, как-то их там клепают, как попало. Но дальше возникает государственный электронный документооборот, который формализован и вообще, по большому счёту, если посмотреть на то, что происходит в мире сейчас, прямо видно-видно, что вот эти циклы взаимодействия начинают уходить в электронщину, полностью погружаться в неё. А как только они становятся электронными, сразу же приходят программисты, которым некомфортно, когда это дело не формализовано, и начинают это делать формализовывать. Не потому, что это эффективно, а потому, что им в базу данных так положить проще. Но они ваш хлеб съедают. 

Иван Ямщиков:

Слушай, во-первых, мы тоже умеем класть в базу данных и довольно неплохо это делаем. А во-вторых, мы умеем находить новый хлеб. 

Дмитрий Завалишин:

Вот я как раз про это. 

Иван Ямщиков:

И, допустим, пример, который я приводил с DLT, это хороший пример, то есть Distributed Lager, это, по сути, blockchain like tecknology. 

Дмитрий Завалишин:

Опиши подробнее. 

Иван Ямщиков:

История в следующем, у тебя есть контракт, ты хочешь что-нибудь экспортировать или импортировать. 

Дмитрий Завалишин:

Лучше экспортироваться. 

Иван Ямщиков:

Ну, конечно, лучше, всегда лучше, конечно. Ты хочешь что-то экспортировать в большом объёме. Но какому-то партнёру, которого ты, может быть, даже и знаешь его, но у вас есть много документов, которые вам нужно подготовить с обеих сторон для того, чтобы оформить эту сделку. Если твой партнёр умеет, ты можешь воспользоваться нашим решением, которое позволяет вам в технологии, которая, по сути, близка к блокчейну, которая повышает уровень доверия к документообороту, ты можешь, во-первых, всё это сделать цифровом виде. Если это уже сделано в цифровом виде, супер если нет, мы это всё конвертируем. И дальше, по сути, проверка экспортной, импортной документации, она происходит похожим образом, как происходит проверка записей в блокчейне. То есть это некая распределённая история, которая позволяет тебе и твоему партнёру удостовериться, что вы соответствуете всем тем правилам, которым должны соответствовать, он со своей стороны, ты со своей стороны, чтобы осуществить эту сделку. 

Дмитрий Завалишин:

Что является источником правил?

Иван Ямщиков:

У нас есть законодательство экспортно-импортное, оно есть у каждой страны, оно может сильно отличаться и т.д. Мы ставили эксперимент, что на порядок сокращает время, то есть если сейчас это может идти несколько дней, оформление такой сделки, то с нашим решением это может идти несколько часов. То есть проверка вся заканчивается, и ты можешь уже переходить. 

Дмитрий Завалишин:

Если бы вас не было, то я бы пошёл к юристу с вопросом: смотри, мне притащили такие документы, проверь их, пожалуйста. 

Иван Ямщиков:

Да, совершенно верно. 

Дмитрий Завалишин:

Похожи ли они на правду, и все равно в этом месте расковал бы. 

Иван Ямщиков:

Да, совершенно верно. 

Дмитрий Завалишин:

Вы в этом вместе говорите, что давайте, мы сейчас проведём онлайн проверку этих документов по имеющейся у вас нормативке, я не приношу её с собой. 

Иван Ямщиков:

Нет, это совершенно, смотри, там нормативка, она устроена более сложным образом, потому что там есть ещё нормативка той страны, ты экспортируешь и так далее. То есть это сложная более история. Но там главное преимущество, как и всегда, в любых такого рода оптимизациях, оно как раз в том, что, когда у тебя есть много, грубо говоря, простых, сравнительно простых правил, которые при этом нужно проверить. Машина проверяет их быстрее, кроме того, в данном случае у тебя есть, в данном случае это решение, я не знаю, какое правильное придумать русское слово. В английском есть хорошее слово unileveral, оно двунаправленное в том смысле, что оно одинаковое для обоих участников контракта, потому что не может быть ситуации, при которой твой юрист решил, что документы хороши, а юрист твоего коллеги решил, что они плохи. Или документы плохи. 

Дмитрий Завалишин:

То есть есть внешние формальные правила, которые мы проверяем. 

Иван Ямщиков:

Да, есть внешний распределённый арбитр. Это может тоже упрощать ситуацию значительно. Ну и соответственно, хеджирует тебя от каких-то рисков, связанных с тем, что твой партнёр, к примеру, начинает, ты экспортируешь куда-то в другую юрисдикцию, а там может партнёр оказаться странным. Я привел этот пример, как историю про то, что по мере того, как какой-то хлеб естественным образом пропадает, потому что мир становится лучше, в нем становится меньше скучной регулятивной работы. Но мы придумываем себе другой хлеб, и это необходимо для любой технологической компании. 

Дмитрий Завалишин:

Пойдём куда-нибудь в сторону того, что Вы сейчас придумываете, где находится новый рынок. Очень понятная картина чисто формальная, пришёл документы разобрать. Довольно понятная картина, когда у нас есть поток документооборота, есть регулятивка, мы должны проверить его на соответствие. Но всё равно это некоторая совсем функциональная картина такая. Вот бегают бумажки, дальше за этим, наверняка, есть смысловая картина, аналитика есть, ты про неё говорил. Как устроено сейчас то, что вы делаете в сторону аналитики, например. 

Иван Ямщиков:

Смотри, ABBY традиционно сильна естественным языком, и мы хотим в этом месте дальше развиваться и продолжаем развиваться. Кроме того, сейчас есть большая история про дигитализацию бизнес процессов, когда у тебя всё на мобильном происходит, когда у тебя всё происходит, когда у тебя на входе, то есть ты, раньше как было, у тебя есть некоторый документооборот, как-то устроен, и потом тебе надо его положить в базу. Сейчас тебе сначала надо положить в базу, а потом он как-то живёт. Для того, чтобы это делать, тебе нужно, чтобы на входе у тебя было мобильное устройство, которое умеет делать практически всё, что нужно для того, чтобы это положить в базу или оно умеет на сервер ходить и так далее. То есть это большая история про, я не знаю, в этой штуке есть, по-моему, начиная с какого-то номера в таких устройствах есть отдельные GPU, который умеет... GPU -это видеокарточка, которая туда сделана не для того, чтобы туда видео делать, а для того, чтобы сделать на ней нейросетки. IPhone нас распознает по лицу, потому что у него есть специальный отдельный чип для того, чтобы на нём бежали bat model машинного обучения. Это второе направление. То есть для ABBYY они, я бы не стал как-то приоритезироыать их, потому что понимание естественного языка, это очень горячо, это очень важно, этого будет только больше. Вернее так, если совсем смотреть далеко в будущее, есть ребята в MIT, которые пытаются сделать флешку для мозга, если мы сделаем флешку для мозга, то естественный язык будет никому не нужен. А до тех пор, пока мы не сделали флешку для мозга, самый лучший способ передавать информацию от одного умного объекта к другому, не важно, это человек или не человек, это речь или текст. Соответственно, естественный язык, это большая история, которой мы давно занимаемся и хотим дальше заниматься. 

Дмитрий Завалишин:

Это тематика перевода. 

Иван Ямщиков:

Это скорее история про понимание, про то, как определить слово «понимание» в контексте тех или иных бизнес задач. 

Дмитрий Завалишин:

Вот-вот, задачи какие, давай пройдёмся по бизнес задачам, которых касается понимание естественного языка. 

Иван Ямщиков:

Их очень много. Если коротко, любая когнитивная деятельность требует понимания естественного языка. 

Дмитрий Завалишин:

Так, шаг ниже.

Иван Ямщиков:

Если шаг ниже, то в бизнесе у тебя есть коммуникация, у тебя есть, на самом деле, давай так, прямо с самого верха. Бизнес - это коммуникация. Коммуникации бывают разных видов, это бывает сделка, это бывает указание, это бывает отчет. 

Дмитрий Завалишин:

Маркетинг вываливается из этой картины полностью. 

Иван Ямщиков:

Ну почему, маркетинг, это тоже коммуникация, просто эта коммуникация, я тебе говорю про коммуникацию внутри организации. Снаружи да, конечно, маркетинг, это коммуникация. 

Дмитрий Завалишин:

Но сказал бы, вы там тоже должны работать в этой тематике, конечно. 

Иван Ямщиков:

На самом деле, смотри, что касается внутри, in house, у тебя есть коммуникация, связанная со сделкой, сделка - это заключение, я тебя взял на работу, или ты меня взял на работу, это то же сделка. Правда ведь? Это отчёт и это некоторые указания. И это три больших типа бизнес процессов, все, любой бизнес процесс, это один из этих трёх типов. Все эти штуки, на самом деле, очевидно, они оптимальны. Если любой человек, который открывал инбокс в здравом уме, знает, что коммуникация внутри, инсайд бизнеса она не оптимальна, поэтому верхний уровень, он на любом из этих уровней, на самом деле, понимание языка может работать. 

Дмитрий Завалишин:

Ты сам сказал слово «инбокс». Я держал его где-то там, в запасничках, чтобы до него дойти. Инбокс, вы заходите уже в инбокс? Продукт понимания. 

Иван Ямщиков:

У нас есть, допустим, корпоративный поиск, который это умеет. 

Дмитрий Завалишин:

Заходить в инбокс. 

Иван Ямщиков:

Который умеет тебе искать по разным источникам внутри компании, неважно, где это лежит. То есть подключаешь тот список источников, по которым ты хочешь искать и ищешь. 

Дмитрий Завалишин:

Это отдельная проблема вообще огромного размера. Насколько я понимаю картину, я сам так точно совершенно считаю и думаю, что в этом смысле генерально по всему миру, у любой компании... 

Иван Ямщиков:

Мне нравится твоя категоричность. 

Дмитрий Завалишин:

Мне кажется, у любой компании есть проблема сохранения знаний. То есть вообще умение сохранить знания. 

Иван Ямщиков:

У любого человека есть проблема сохранения знаний. 

Дмитрий Завалишин:

У человека хрен с ним, его продать труднее, потому что компанию продать легче, она, мало того, что осознанна, она ещё и в деньги вываливается. 

Иван Ямщиков:

Совершенно верно. 

Дмитрий Завалишин:

Очень чётко понимаем, что у нас человек пришёл, что-то поделал, сделал проект, что-то понял, осознал, потом он рано или поздно уволился всё равно, знания, которые он наработал либо с ним ушли, либо остались в виде очень плохого футпринта такого, слабенького такого. Если они остались в виде живого проекта, ещё слава богу, всё остальное похоронили, по большому счёту. Это же прямо ваша тема. То есть вообще, задача сохранения знаний, структуризации знаний, ложится на всё то, что вы умеете, как родная. Неужели вы этим не занимаетесь. 

Иван Ямщиков:

Слушай, есть, допустим, внешний проект. 

Дмитрий Завалишин:

Ты сейчас сказал про поиск, это плохая картина, почему я сюда пришёл, потому что, господи, оно странное по разным углам, вы, конечно, что-нибудь найдёте. Но если сделать шаг чуть раньше и пытаться не искать, а сразу забирать откуда-то из процесса. 

Иван Ямщиков:

Это крутая идея, на самом деле, наверное, в этом направлении всё будет всё равно двигаться неизбежно. Но возвращаясь к твоему вопросу, есть отличный пример, который я очень люблю. По-моему, 12 млн. £ было потрачено лишними деньгами на какой-то проект в рамках лондонской олимпиады из-за ошибки в Excel документе. Из-за того, что там как-то неправильно была разрешена зависимость. Есть много прекрасной статистики про то, что в среднестатистической компании в Европе файл, приложенный к письму, живёт дольше, чем сотрудник его отправивший. 

Дмитрий Завалишин:

Какая шикарная цифра, спасибо тебе за неё. 

Иван Ямщиков:

Круто, да? То есть ты, конечно, прав, и это большая проблема. Потому что люди не думают о том Digital футпринт, который они оставляют, люди, которые пишут код, плохо пишут комментарии, что уж говорить про людей, которые работают маркетологами. Соответственно, да, это проблема и конечно, в этом направлении что-то и будет происходить, и уже происходит. Я не совсем согласен с тобой, что поиск, это плохое решение, потому что, на самом деле, это просто правильно первый шаг. 

Дмитрий Завалишин:

Он неизбежный. 

Иван Ямщиков:

Тебе нужно правильно индексировать внутренний документооборот, я не говорю, что мы не будем дальше по этой дороге идти, наверняка будем, потому что действительно, это важный кусок. Ещё одна мысль, которая по этому поводу, вообще, о которой, мне кажется, стоит думать, она сильно связана с тем, если мы возвращаемся к теме инбокса, она сильно связана с тем как у нас меняется коммуникация. У нас последние 100 лет есть очевидный тренд на то, что коммуникация должна быть быстрее. И вообще, эта идея итеративного апдейта версий, её апогеем является Github, условно говоря. То есть любые китового плана технологии, мы сейчас начинаем так думать. То есть мысль, как некоторая итеративно апдейтищаяся история. Любая мысль. Это большая, интересная тема, и она... 

Дмитрий Завалишин:

Можно я по-другому спрошу, чтобы высветить... 

Иван Ямщиков:

Если посмотришь науку, публикации в науке, они так же устроены. 

Дмитрий Завалишин:

Я просто чётко совершенно осознал, прямо очень жёстко настаиваю на таком формате. Например, мы с клиентом взаимодействуем, клиент запуска проекта, и клиент говорит: сейчас, вы знаете, мы сейчас напишем ТЗ. И первое, что я им говорю: не надо. Вот у вас есть сегодня что-то в голове, откройте гуглдок, вылейте в него всё, что есть сейчас, вот сию секунду, ни секунды не затормаживая, отдайте его нам или кому-то ещё. 

Иван Ямщиков:

Да, такой симлес процесс непрерывного обновления. 

Дмитрий Завалишин:

И дальше мы пойдём его апдейтить, мы будем вопросы задавать, Вы будете его апдейтить, это некоторый процесс жизненный такой. Ты про это сейчас говоришь?

Иван Ямщиков:

Да, я про это говорю. 

Дмитрий Завалишин:

Что такая итеративная модель. 

Иван Ямщиков:

У тебя возникает история, обратной стороной медали в этой мысли, в этой ситуации возникает проблема, которая связана с тем, что 90 % мыслей не додуманы. Это естественное состояние, 90 % мыслей, они не додуманы. 

Дмитрий Завалишин:

Отличная фраза, причём она такая, прямо она абсолютно верная.

Иван Ямщиков:

И мы пока, на самом деле, внутри, мне кажется, ни одна более-менее бизнес организация не решила для себя, какой из двух вариантов лучше и где находится правильный баланс. Потому что очевидно, что ситуация, когда всё забюрократизировано, когда любая мысль додумана, но тогда там мыслей очень мало. 

Дмитрий Завалишин:

Ну да, всё залито бетоном и не шевелится. 

Иван Ямщиков:

А в другой стороне у тебя вечная разработка и отсутствия MVP. И в этом смысле как правильно этот баланс устроить, это очень сильно зависит от процессов внутри и, конечно же, в этом месте автоматизация и правильный скоринг того, что происходит, правильная наладка процессов того, как люди взаимодействуют друг с другом, это очень большая история для автоматизации. И в этом месте нам ИИ конечно может помочь, потому что ИИ может очень хорошо оценивать качество по формальным признакам. То есть мы сами плохо умеем по формальным признакам, мы придумали идею, она нам очень нравится. У когнитивных психологов есть прекрасная история про то, как первая идея, она всегда не самая креативная, креативная она обычно после долгого периода фрустрации, то, что к вам приходит в голову. А то, что первое, но при этом ты его жутко любишь, эту мысль, тебе всегда кажется, что ты просто гений, чертов гений, ты придумал что-то потрясающее. Но, на самом деле, к сожалению, это не всегда так. ИИ в этом месте, конечно, для тебя, ИИ, понимающий, естественно, язык, для тебя огромный помощник, потому что он тебе говорит... 

Дмитрий Завалишин:

Фигня, подумай ещё. 

Иван Ямщиков:

Да, конечно, и в этом смысле так примерно работают какие-нибудь креативные пары, то есть очень часто какие-то штуки, требующие как раз большого объёма креативных решений.

Дмитрий Завалишин:

Называется подумать от кого-то. 

Иван Ямщиков:

Да, люди думают вместе. И внедрение в том или ином виде в эту процедуру ИИ, который понимает естественный язык, это большая вообще тема, очень интересная. 

Дмитрий Завалишин:

Мы сейчас говорим всё-таки о потенциальном будущем, или есть какие-то инструменты, продукты, которые сейчас работают?

Иван Ямщиков:

Есть много интересных инструментальных продуктов, я бы не сказал, что это продукты, это скорее прототипы, интересные экспериментальные прототипы про то, как есть хороший, допустим, ted talk писателя, который сделал себе нейросетку, которая позволяет ему писать научную фантастику. Он её обучил на массиве данных научной фантастики. И когда у него writer’s block, когда он затыкается в какой-то момент, он раз, Tab нажимает, у него плагин поверх какого-то контекстового редактора, он на Tab нажимают, и ему раз, раз несколько словосочетаний. 

Дмитрий Завалишин:

Параграф.

Иван Ямщиков:

Нет, словосочетаний, буквально пара, тройка слов. И в какой-то момент он: вот, это прикольно. И у него мысль дальше пошла. 

Дмитрий Завалишин:

Если посмотреть на такой таймлайн большой, то много лет назад люди писали трактаты и длинные письма, потом это стали e-mail, а сейчас это твиты.

Иван Ямщиков:

Но твит стал больше уже в 2 раза. 

Дмитрий Завалишин:

Черт возьми, то есть мы возвращаемся к истокам. 

Иван Ямщиков:

Как Егор Летов пел, маятник качнулся в правильную сторону. 

Дмитрий Завалишин:

Идём к истокам, обратно, не верю нифига. Совершенно очевидно, что фрагментализируется вот этот процесс коммуникации, он превращается в поток мелких-мелких событий. Мало того, ещё одна важная вещь, опять же, про то, что я говорил, про e-mail. Человек контекст начинает терять, очень быстро ты начинаешь понимать, что локальный контекст, локальный, это прямо локальный, 5 минут. Я приведу пример, у меня как-то был случай, был большой аврал по работе с крупным клиентом. Собралось много людей, как это обычно делается, делали канал, и в нем все сидели, разбирались с ситуацией. Я лично в нём сидел, прямо был очень крупный аккаунт, и смотрел. Я очень быстро понял, что через 4 часа, то, что 4 часа назад люди поняли, осознали и хотели проверить, через 4 часа было забыто, потому что тогда не было сотрудника, который может, в этот раз он пришёл, но не было сотрудника, который придумал. И вот эта мысль исчезла. В этом месте два вопроса. Первый вопрос мы задавать не будем что будет с человечеством, как оно вообще переживёт такую беду, потому что, на самом деле, страшно выглядит. А второе, это же, кажется, ваша тема. В этом месте AI может брать и вести эту тему. 

Иван Ямщиков:

Во-первых, да, во-вторых, мы это уже немного обсудили, это та самая история про процент недодуманных мыслей. Это абсолютно то, о чем я тебе говорил, это та проблема, которая есть, в этом смысле есть совершенно великое кино, называется «Путь иноходца» про Григория Перельмана, про Гришу Перельмана. И там есть великий русский математик, Миша Громов, который работает в Париже уже довольно давно. Он, по-моему, лауреат Нобелевской премии, чуть ли не дважды. Он в какой-то момент великолепную вещь говорит. Когда его спрашивают, почему Перельман уехал из США и сидел в Петербурге столько лет. Он говорит: человек хотел задуматься над проблемой как следует, ему для этого нужно, чтобы его никто не трогал, ему для этого потребовалось семь лет. Семь лет человеку потребовалось, он задумался над проблемой и её решил. Всё. Это способность сосредотачиваться, то есть это, на самом деле, способность к сосредоточенному интеллектуальному усилию, которое, на самом деле, бывает важно. Другое дело, что когда у тебя бизнес процессы устроены так, что ты разрешаешь, чтобы у тебя 99 % мыслей были недодуманы, тогда ты естественным образом выкорчёвываешь эту способность к интеллектуальному усилию и выкорчёвываешь людей, обладающих этой способностью. 

Дмитрий Завалишин:

Это очень трудно не разрешить. 

Иван Ямщиков:

Тонкий момент, он заключается в том, что ты должен для своего бизнеса понимать, сколько тебе, на самом деле, нужно людей способных к этому интеллектуальному усилию. Я совершенно убеждён, что это решается на уровне HR, а не на уровне процессов. 

Дмитрий Завалишин:

Ну, подожди, мы здесь про компанию ABBYY разговариваем. Ты сейчас какой-то другой компании пас сейчас дал. 

Иван Ямщиков:

Слушай, мы не пытаемся забрать себе весь рынок. Мы говорим, эта история, она связана с тем, как всё должно быть устроено, потому что то, что нужно поддерживать контекст внутри коммуникации, это всё действительно можно делать, это всё здорово, но это не отменяет того, что в любой компании у тебя должен быть процент людей, способных к интеллектуальному усилию. В компании ABBYY он есть, благодаря этому компания ABBYY делает хороший продукт. 

Дмитрий Завалишин:

Их запирают в тёмные комнаты, выключают телефоны, отнимают телефоны. 

Иван Ямщиков:

Да нет, ты знаешь, когда человеку интересна его задача, когда человеку интересно то, что он делает, он сам может выключить телефон, просто сесть и подумать. 

Дмитрий Завалишин:

Восхитительно. 

Иван Ямщиков:

И в этом, на этих людях многое держится. 

Дмитрий Завалишин:

То есть компания ABBYY нам сегодня говорит, что, несмотря на то, что у неё есть феноменальные технологические инструменты, которые готовы нам помочь организовать ноосферу нашу, можно я так скажу. 

Иван Ямщиков:

Давай. 

Дмитрий Завалишин:

Отлично. Тем не менее, будущее человечества в руках человека и его способности оторваться от мирского и погрузиться в гениальную задачу. 

Иван Ямщиков:

Ура!

Дмитрий Завалишин:

Поздравляю компанию ABBYY. 

Иван Ямщиков:

Спасибо большое, очень здорово получилось. 

Дмитрий Завалишин:

До свидания.