ABBYY

Арам Пахчанян: Атака зарубежных банков в России будет в первую очередь технологической

Арам Пахчанян 
Закон об обязательном страховании автогражданской ответственности вызвал заметное повышение активности среди страховых компаний. В ожидании бума заключения договоров, страховщики активно расширяли штаты, проводили обучение специалистов и, конечно, активизировали процессы автоматизации. Разработчики программного обеспечения поспешили воспользоваться возникшим спросом, и выпустили специализированные решения для страхового рынка. Российская компания ABBYY, производитель системы распознавания Fine Reader, словаря Lingvo и ПО для ввода форм Form Reader, объявила о выпуске специализированного решения по вводу документов для страховых компаний уже после начала работы закона. Однако вице-президент компании ABBYY Арам Пахчанян убежден, что ситуация с автоматизацией страховых компаний коренным образом начала меняться только сейчас. И шансы на успех имеет лишь то решение, которое прошло максимальную отладку, и было тщательно подготовлено к работе в страховом бизнесе.

 
CNews.ru: Как вы расцениваете существующую ситуацию на российском рынке систем оптического распознавания? Насколько сильна конкуренция на этом рынке?

Арам Пахчанян: Прежде всего, я хотел бы определиться с терминологией. Оптическим распознаванием (Optical Character Recognition, OCR) называются продукты и технологии, превращающие бумажные документы с печатным текстом в редактируемые электронные файлы. То есть, документ с печатным текстом сканируется, затем его «фотография» поступает в систему распознавания, она берет этот набор черных и белых точек и превращает его в документ с редактируемым текстом.

Есть и другие технологии распознавания. Например, ICR (intelligent character recognition), которая предназначена для распознавания рукописного текста. Она не обладает какой-то особой «интеллектуальностью», но так уж назвали. Для рукописного текста, реальным практическим применением, за исключением некоторых рынков, стало лишь распознавание отдельно написанных рукописных символов в так называемых машиночитаемых (жестких) формах. Это формы, все поля которых совпадают на просвет, например — формы налоговой декларации, анкеты, бланки заявлений, результаты тестов и проч. Распознавание рукописного текста из машиночитаемых форм (называется обработкой форм, или form processing) нашло очень широкое применение и в мире, и в России. Дело в том, что эта технология существенно облегчает процесс получения информации от массовых аудиторий — от налогоплательщиков, покупателей, респондентов, тестируемых и проч. Задача распознавания слитного рукописного текста пока не решена, а область применения таких технологий не позволяет окупить инвестиции на их разработку.

Третьей технологией стало распознавание в режиме реального времени, т.н. онлайн-распознавание. Оно используется в различных планшетных ПК, карманных компьютерах и им подобных устройствах. Эта технология гораздо более проста по сравнению с распознаванием написанного текста на бумаге, так как дополнительная информация, касающаяся написания, поступает в программу сразу и в достоверном виде. Например, для распознавания символа очень важен параметр, определяющий то, какая часть буквы была написана раньше. В отличие от символов, написанных на бумаге, в планшетном ПК такая информация присутствует изначально. Кроме того, эту технологию можно обучить под особенности написания букв конкретным и единственным пользователем.

CNews.ru: Каковы позиции ваших продуктов на всех этих рынках?

Арам Пахчанян: На российском рынке оптического распознавания (OCR), то есть распознавания печатных документов, ситуация давно является стабильной и ясной. Продукт ABBYY Fine Reader, по разным оценкам, занимает от 85% до 96% розничных продаж систем распознавания. Остальные системы занимают очень небольшие доли рынка, и фактически, не продаются.

На проектном рынке OCR ситуация более сбалансированная. Однако большая часть продаж OCR-систем в проектных решениях осуществляется в составе систем поточного ввода документов и электронного документооборота. Большинство компаний, предлагающих такие решения, интегрировали в них механизм FineReader. Нашим прямым конкурентом является компания Cognitive Technologies, продукт которой также иногда интегрируется в системы документооборота и ввода документов. Например, в собственную систему документооборота от Cognitive Technologies.

Для рынка систем ввода форм компания ABBYY предлагает ICR-технологию ABBYY FormReader. Фактически, именно компания ABBYY развивает этот рынок в России, участвуя в самых крупных и сложных проектах по обработке форм, «образовывая» рынок, совершенствуя технологию. Мы были первыми, кто реализовал крупные и особо сложные проекты по обработке форм — например, ввод налоговых деклараций Министерством Налогов и сборов; обработка результатов Единого Государственного Экзамена (ЕГЭ), обработка анкет Пенсионного Фонда и сотни других проектов. Самое главное — мы были первыми, кто сделал универсальный, коробочный продукт для решения проблемы ввода форм. Он распространяется под маркой ABBYY FormReader. Так что теперь это решение доступно не только огромной организации, но и рядовому банку, которому нужно обрабатывать анкеты на открытие пластиковых карт или страховой компании, в которой вводят вручную тысячи заявлений от страхователей, супермаркету, обрабатывающему анкеты покупателей и т.д. Впервые в мире ABBYY сделала эту технологию доступной для компаний среднего размера и у нас уже есть в России несколько десятков средних по масштабу проектов.

CNews.ru: Насколько быстро развивается продвижение ABBYY на рынках за пределами России?

Арам Пахчанян: На мировой рынок компания ABBYY вступила значительно позже западных конкурентов. Из-за этой временной разницы, несмотря на преимущество нашей технологии, у иностранных компаний все еще есть преимущества на горизонтальных рынках. Однако на вертикальных рынках, в профессиональных применениях, мы уже обгоняем конкурентов. Рано или поздно, информация от профессионалов сама придет к рядовым пользователям, и соотношение также будет в нашу пользу. Профессиональная зарубежная пресса уже давно признала превосходство нашей технологии, и соотношение наград, присуждаемых нам и конкурирующим продуктам уже сейчас 20:1.

За границей наши технологии и продукты достаточно распространены. Они интегрированы в самые различные системы поточного ввода, и поставляются со многими сканерами, работают в системах ввода форм и так далее. Система распознавания (OCR) ABBYY FineReader занимает второе место по объему рынка после американского конкурента, который продавал свои OCR с десяток лет до нашего появления. Теперь мы постепенно наращиваем свою долю на более интерном розничном рынке и давно уже стали лидерами на профессиональном.

Мы никогда не скрывали, что нашей целью является сделать всемирный продукт, который должен в итоге поддерживать все мировые языки. И это не является простым желанием «полететь в космос». Одним из следствий такой политики является наша успешная работа с производителями сканеров. ABBYY FineReader поставляется почти с половиной сканеров, распространяемых в мире, и для производителя гораздо удобнее на всех заводах и для всех стран вкладывать один единственный комплект ПО, не обращая внимания на будущий регион продаж. Кроме того, временная полноценная версия, поставляемая со сканерами, позволяет использовать его в течение гарантийного периода с полнофункциональной версией FineReader, а значит клиент, скорее всего не вернет сканер в магазин. Это более эффективно, чем любая реклама в прессе.

Помимо OCR системы FineReader, несколько лет назад ABBYY начала активно продвигать на мировом рынке продукт для ввода форм — FormReader ICR. Сейчас ABBYY FormReader уже используется в нескольких страховых компаний и в нескольких банках за рубежом. В Европе бизнес по вводу форм развивается уже десятки лет. Там есть традиционные поставщики, и многие проекты, требующие таких решений, уже давно реализованы. Поэтому за рубежом новые продукты используются только в случае возникновения новых потребностей, в отличие от России, где проекты по вводу форм практически отсутствовали. Мы стремимся занять серьезную долю страхового рынка в Европе и США, активно работаем на рынке небольших проектов, который мы считаем очень перспективным. У нас есть несколько интересных проектов по обработке счетов, например с Deutsche Telecom.

В сравнении с российским рынком, в западных проектах конкуренция острее. Одно из наших конкурентных преимуществ — это высокие стандарты ответственности перед клиентами. Наш подход здесь тоже очень помогает в завоевании позиций на рынках других стран. Даже если у клиента возникают проблемы, которые было невозможно предугадать, и если мы ясно видим, что не получим прямой выгоды от их решения, мы обязаны пытаться их решить. Конечно разумными методами, не бросая все дела, но используя все ресурсы, какие возможно.

Кроме того, изначально мы ориентируемся на долгосрочное партнерство, и если сотрудничество начинается, то оно ориентируется на длительные взаимоотношения. В разных странах подходы, как к клиентам, так и к партнерам по бизнесу, сильно отличаются от принятых у нас. В Японии, например, такие нормы отношений с клиентом — это неписаные законы, которые нельзя нарушать ни в коем случае. И если сотрудничество с партнером было начато, то оно будет продолжаться в течение практически всей жизни. Аналогичная ситуация и в остальной Азии, Сингапуре, Южной Корее и других странах региона. В Европе ситуация несколько иная, и там партнерство не всегда ведет к личной дружбе. Партнеры могут поссориться, если бизнес станет невыгодным. До крайности доходит в Америке. В этой стране все определяется одним днем: сегодня мы друзья, а завтра мы враги. И сейчас, после обвала «дот-комов», массовых банкротств и других сложностей рынка высоких технологий, стало заметно, что продолжают работать именно те компании, которые имеют долгосрочные отношения с клиентами и партнерами, которые заботятся о своем имидже и благополучии клиента. Такая репутация очень хорошо работает на нас, особенно на таких серьезных рынках, как наш. Профессионально на них работает буквально две-три компании, и те, кто вкладывают миллионы долларов в продукты, в которых используются наши технологии, нам очень доверяют.

Становится гораздо проще решать все проблемы во взаимоотношениях, когда известно и понятно, что мы их не подведем и всегда готовы помочь. Наши партнеры знают, что мы не будем, как монополия, резко поднимать цены, не станем их шантажировать, и наше поведение всегда останется порядочным и честным. Если этого не делать, то любые перспективы на международном рынке останутся краткосрочными. Все это создает климат вокруг компании, который формирует наш имидж в Азии и Европе. Однако очень быстро растет и наш американский бизнес. В прошлом году он увеличился в два раза, в этом году мы ожидаем роста в 30–40%. Европейско-азиатский бизнес также показывает хорошие результаты. В Европе у нас даже больший сегмент рынка, чем в США. Однако в Америке мы сейчас ведем несколько переговоров с крупными компаниями, и это может оказать большое влияние на итоговые результаты.

В Азии наш успех был очень неожиданным для нас самих. Ведь Fine Reader не умеет вводить буквы некоторых азиатских алфавитов, и «умеет» работать только с цифрами. У нас уже есть стабильный доход на этих рынках, серьезные партнеры, которые выступают на местных выставках со стендами, оклеенными нашими плакатами. Кроме того, наши клиенты на этих рынках довольны именно нашей политикой, в сравнении с тем, как там работают компании из Америки. Мы не меняем цены, у нас всегда постоянное отношение к партнерам, мы готовы идти на специальные цены для отдельных клиентов, тогда как американцы всегда считают, что их пытаются обмануть, и так далее.

CNews.ru: Какие направления роста наиболее актуальны для вашей компании? Как расставлены приоритеты в развитии бизнеса компании?

Арам Пахчанян: Если говорить о системах ввода как форм, так и обычных документов, то основных приоритетов четыре. Во первых, это электронный документооборот. Мы активно участвовали в создании и формировании этого рынка в нашей стране. Нами в 1995 году была организована конференция DOCFLOW, которая очень помогла его развитию. Сегодня мы, по сути, пожинаем результаты. И хотя это рынок в России пока небольшой, он растет как на дрожжах. Большая его часть, в отношении системы ввода информации, достается нам. В собственно вводе информации присутствует два основных направления — это ввод бумажной информации и индексирование документов для полнотекстового поиска. Для индексирования требуется технологии распознавания без всяких дополнительных функций и средств работы с документами в бумажном виде. Его основным результатом должен быть неформатированный текст, который затем индексируется для полнотекстового поиска. Системы ввода информации несколько более сложны. Для них требуется автоматическая идентификация документов, разделение потоков документов — на сканере обычно лежит большая пачка разных документов, которые необходимо разделять на отдельные документы, и так далее. Для некоторых документов обязательно необходима верификация и различные дополнительные сервисы. Такие системы ввода являются придатком для электронных архивов и электронного документооборота.

Следующий по важности для нас рынок — это банковский. Он бурно развивается и конкуренция на нем очень высока. Уже более 500 банков используют нашу систему FineReader Bank, однако мы видим большой потенциал роста, и намерены внедрять на нем сразу несколько наших продуктов. Они и сейчас обладают большими конкурентными преимуществами, но особые ожидания мы связываем с приходом в страну зарубежных банков. Российские банки к этому событию активно готовятся, и в том числе и технологически. И в связи с тем, что сама атака зарубежных банков будет в первую очередь технологической, для того, что бы против нее выстоять, российским банкам необходимо иметь максимально высокий уровень собственной технологической подготовки.

Еще один из важнейших для нас сегментов рынка — это страховые компании. В нашей стране уже стабилизировалась экономическая ситуация, явно возникает необходимость в «длинных» кредитах. Следовательно, необходимо и страхование таких кредитов, стало актуальным медицинское и автострахование, другие страховые услуги. В связи с этим мы ожидаем бурного роста страхового рынка, и он также является приоритетным направлением нашего развития.

И, наконец, областью наших интересов являются розничный и производственный бизнес. В России давно начался процесс автоматизации предприятий, имеющих большое число контрагентов. Задачи таких компаний лежат в области автоматической обработки и ввода большого количества счетов, и других документов. Пока в России есть недорогая рабочая сила, которая справляется с задачей обработки большого числа входящих документов. Однако компания, повышая общий уровень своей работы, сталкивается с ситуацией, когда при ручном вводе в компьютерную систему большого количества документов резко падает их качество. Об этом написано во всех учебниках и неоднократно говорилось в прессе. Уже готовые рабочие места и цеха по вводу документов понемногу переоснащаются в сторону автоматизированного ввода. Мы активно работаем на этом рынке, и он нам кажется очень интересным.

CNews.ru: Расскажите об особенностях внедрения систем распознавания в банках и страховых компаниях. Чем отличаются требования банков от требований страхового рынка?

Арам Пахчанян: Во-первых, в России банковский рынок существенно старше страхового. Банковский бизнес требует определенного уровня дисциплины, и даже на самом старте этого бизнеса в современной экономике России уже было понимание необходимости использования информационных технологий. Банки активно внедряли различные системы автоматизации, и первые российские банковские системы появились и развивались одновременно с появлением и ростом российских банков серьезной формации. Со страховыми компаниями все происходило немного не так. Этот бизнес может на первоначальном этапе работать традиционными методами, то есть, используя бумажные папки с документами, бумажные дела, ручной поиск и так далее. Лишь через некоторое время после начала деятельности внедряется автоматизация, начинает вестись база данных с наиболее важными полями. Затем она расширяется, и автоматизация может идти довольно вялыми темпами.

Коренным образом ситуация начала меняться только сейчас. Компании, которые имеют распределенную сеть филиалов по всей стране, задумались о создании электронных линий связи между отделениями и о ведении единого хранилища баз данных клиентов. Только сейчас начинается унификация правил работы с агентами. Помимо этого, назревший вопрос, активно обсуждаемый сейчас внутри страхового сообщества, — это прямой выход компании на клиента. Изначально основой всего страхового бизнеса является агент. Нет хороших агентов — нет и бизнеса, так как в классических видах страхования, компания не может привлечь к себе клиента без помощи агента. Однако сегодня уже появились новые услуги, на которые есть активный спрос — это автострахование, которое станет когда-нибудь обязательным, страхование квартир, которое также вскоре может стать обязательным, страхование жизни в пользу родственников, и тому подобное. Они распространяются не столько агентами, сколько горизонтальным способом — через друзей и знакомых тех, кто уже застрахован. На первый план выходит лояльность имеющихся клиентов, их информирование, и другая подобная прямая работа.

Помимо этого, активно идет процесс превращения страховой компании в финансовый институт. Если банк выдает кредит на покупку жилья, то страховая компания может это сделать в виде особой страховой схемы. То есть, страховые компании имеют возможность де-факто кредитовать клиентов, и во всем мире страховые институты уже составляют активную конкуренцию банкам. Эта тенденция в России идет даже более быстрыми темпами, чем это было на Западе. Стабильная экономическая ситуация побуждает людей к страхованию, так как именно оно может гарантировать стабильность и уверенность в будущем. Обязательное страхование автогражданской ответственности (ОСАГО) на сегодня является для страховщиков не только способом заработка, но и возможностью привлечения в страхование новых клиентов, которые раньше в нем не участвовали. Все это ведет к тому, что страховые компании в ближайшем будущем будут более агрессивно автоматизироваться и внедрять новые технологии.

CNews.ru: Насколько может помочь в работе страховой компании внедрение технологий машинного распознавания?

Арам Пахчанян: Буквально несколько недель назад мы проводили семинар для страховых компаний, на котором рассказывали об особенностях применения наших продуктов в этом бизнесе. Там были и представители компаний, уже работающих с нашими продуктами.

Основной задачей автоматизации деятельности страховой компании на массовом рынке является ввод форм заявлений и различных бланков. Мы выпускаем коробочный продукт ABBYY FormReader, в котором уже есть все необходимые средства для ввода практически любых форм, какие могут потребоваться. Однако для страховых компаний мы создали специализированное решение, приспособленное к конкретным нуждам страхования, и в том числе и к ОСАГО. Акцент на обязательном автостраховании сделан потому, что оно является наиболее актуальной темой на сегодня, и именно на этом направлении наибольший интерес у компаний. Мы уже внедрили эту систему в крупных страховых компаниях, таких как РОСНО, НАСТА и некоторых других, она прошла проверку и успешно работает.

Сегодня мы предлагаем страховым компаниям весь спектр подходов к автоматизации ввода форм. У некоторых из них есть полноценный департамент информационных технологий. Такие клиенты могут использовать наш продукт ABBYY FormReader Developer Edition, предназначенный для самостоятельной модификации, и встроить его в уже работающую информационную систему так, что бы добиться наибольшей эффективности. Другие компании могут взять готовую компоненту, которая реализует общую для страховых компаний функциональность, самостоятельно немного доработать, и начинать использовать.

Еще один продукт, ABBYY FormReader Enterprise Edition, предназначен для распределенного ввода документов в компаниях, у которых есть отдельные рабочие места для ввода и верификации. Его также можно адаптировать под конкретные потребности компании. Мы готовы помочь нашему клиенту разобраться в том, что необходимо дополнительно для полноценной работы, порекомендовать технику, настроить решения, провести полноценный проект и так далее. Однако опыт показывает, что компании готовы сделать все это сами. Дело в том, что эта технология становится опорной для бизнеса, и когда в следующий момент изменяется задача, компания предпочитает иметь возможность самой изменить существующее решение. В итоге часто первичной целью является не просто реализация конкретной задачи, сколько освоение технологии для дальнейшего ее применения. Это выгодно и нам, т.к. постоянно приобретаются новые лицензии, и самой компании, потому что она становится обладателем технологии. Поэтому мы передаем клиенту полноценный коробочный продукт с инструкциями и поддержкой. Этот подход находит отклик у страховых компаний, в отличие от предложений сделать необходимое решение сразу и сейчас, а когда потребуется что-то новое, заплатить такие же деньги за другое решение. Конечно, мы можем реализовать решение «под ключ», но опыт показывает, что у большинства клиентов все получается самостоятельно.

Кроме того, важно то, что продукт создан не только для Москвы и России, но и для использования в других странах мира. Мы не можем силами одной только ABBYY внедрять его по всему миру, где есть интерес к нашим технологиям, поэтому создаем максимальные возможности по внедрению наших решений в уже работающую инфраструктуру для самого покупателя.

CNews.ru: Известно, что у систем ввода есть серьезная особенность — для них стоимость ошибки внедрения очень высока.

Арам Пахчанян: Это действительно так. Например, ошибка в процедуре обработки формы будет повторяться в каждом введенном документе, и она будет присутствовать на каждом из миллиона введенных документов. Это может привести к миллиону ручных операций по исправлению. Потому наши партнеры, занимающиеся работой с клиентами, должны очень хорошо разбираться в той сложной технологии, которую мы создали, и для этого мы активно проводим их обучение и тренинги. Специальная версия для страховых компаний не затронет основ технологии. Мы окружили сам продукт новой программной оболочкой, которая адаптирует продукт под конкретную задачу. Она упростит интерфейс, обеспечивает поддержку дополнительных форм и экспорта документов в некие специализированные форматы для страховых компаний.

CNews.ru: Насколько сложно разработать отраслевое решение? Оно требует незначительной модификации продукта или глубокой его переделки?

Арам Пахчанян: Для компании ABBYY это не очень сложно. У нас есть отдельные компоненты, которые можно компоновать в соответствии с требованиями клиента. Однако мы никогда не спешим с разработкой такого решения. Ибо самая большая глупость, которую можно сделать в разработке ПО, это сначала сделать продукт, а потом не знать на какой сегмент рынка его ориентировать. Поэтому мы очень терпеливо и кропотливо работаем с клиентами, выясняем полный спектр их задач и потребностей, разрабатываем требования к новому продукту. Примером этого подхода стал продукт для страхового бизнеса, который выйдет не в самый разгар обсуждения темы ОСАГО, а в самый необходимый для этого момент.

CNews.ru: Приходится ли в процессе внедрения системы распознавания изменять бизнес-процессы компании и проводить консалтинговые работы?

Арам Пахчанян: Одно время очень модно было проводить реинжениринг бизнес-процессов на предприятии. Однако я считаю, что хорошо работающее предприятие — это своего рода чудо. И лезть в него «с ланцетом» я считаю неправильным. Многие ИТ-компании, которые берутся за реинжениринг, на самом деле слабо себе представляют, как должен работать именно тот бизнес, который они рвутся перестроить.

С самого начала одним из приоритетов разработки были удобство и способность наших продуктов точно адаптироваться под нужды наших клиентов. Мы ни в коем случае не хотим, чтобы внедрение наших продуктов означала реформирование бизнес-процессов клиента — ведь тогда цена внедрения становится выше экономической выгоды от внедрения. И эту позицию мы считаем залогом успеха ABBYY и в России и во всем мире. Вся разработанная нами технология должна быть максимально гибкой и эффективной. Поэтому, если наш продукт или технология являются лишь частью необходимого клиенту решения, мы с удовольствием участвуем в качестве субподрядчика, предоставляя свои технологии партнеру, работающему с клиентом.

CNews.ru: Как клиенты относятся к необходимости изменения привычных форм документов?

Арам Пахчанян: Иногда приходится переделывать вид форм в процессе работы. Для нас форма- это расположение полей, толщина линий, а не содержание вопросов. В России достаточно четко определилась тенденция, согласно которой под формой в первую очередь понимается не состав полей, а их расположение на листе, дизайн формы, может немного изменяться. В большинстве проектов ставить квадратики для букв и делать форму машиночитаемой можно и без серьезных согласований.

CNews.ru: Председатель Госкомстата на последней пресс-конференции говорил, что очень сложно заставить отечественные предприятия и компании внедрять у себя машиночитаемые бланки, и что внедрением этой культуры необходимо заниматься не один год. Насколько часто ABBYY сталкивается с такой проблемой?

Арам Пахчанян: Странно, дети, сдающие единый государственный экзамен, как-то справляются с заполнением машиночитаемых бланков. И все у них отлично получается с первого раза. И миллионы этих бланков из 47 регионов России обрабатываются с помощью ABBYY FormReader за 5 дней. Если бы там было много ошибок, поправок или проблем с заполнением, то обработать эти миллионы бланков и выставить оценки ученикам в такой рекордный срок было бы просто невозможно.

А по поводу мнения Председателя Госкомстата, то мне кажется, что Госкомстат вообще не пытался серьезно внедрить технологии обработки форм. По крайней мере, в наше предприятие инструкции по сдаче статистики на таких формах не приходило. Я считаю, что российские субъекты бизнеса, юридические лица — это крайне дисциплинированные люди. Если государственные органы отдают указание, что надо делать «вот так», то они сразу его исполняют, и только потом разбираются, законно это или нет, и было ли необходимо это делать. Формально, многие распоряжения, например налоговых органов, можно не выполнять, однако все понимают, что с властью необходимо сотрудничество. По крайней мере, это понимают те компании, которые занимаются реальным бизнесом.

Поэтому если компании получают указание сдавать отчетность на машиночитаемых бланках, они сдают ее именно на таких бланках. А если получают указание сдавать на дискетах, то сдают на дискетах. Если у маленького предприятия нет компьютера, то тут же появится агент, который будет за них набивать и сдавать документы туда, куда требуется. Это все решаемые вопросы. В регионах электронный способ передачи данных остается сложным вопросом. Приказ закупить компьютеры, когда не хватает денег на зарплату — это уже на грани фола. И налоговая служба, например, не может навязать такие методы. Совсем недавно Министр РФ по налогам и сборам г-н Букаев подписал приказ, согласно которому в следующем году будет введена по всей России единая форма машиночитаемых бланков для сдачи бухгалтерской отчетности на бумажных носителях. Это решение отлично подходит для тех предприятий, где нет компьютеров.

Причиной того, что Госкомстат до сих пор не ввел электронной формы отчетности, я считаю не предприятия, которые не хотят этого делать. Это больше непорядок в работе конкретных чиновников. Если бы безбумажной отчетности не было бы в других ведомствах, если бы вся таможня не перешла на электронный документооборот, если бы Пенсионный Фонд и налоговая инспекция не внедрили машиночитаемые формы, можно было бы говорить о системной проблеме страны. Возможно, перепись и огромные расходы на нее помешали Госкомстату перейти на современные технологии. Это был огромный проект, хотя по масштабам и сложности его трудно сравнить с Единым Государственным Экзаменом. Одиннадцать лет на подготовку однократного статистического мероприятия, где допустим определенный процент ошибок, не сравнимы с тем, что приходится делать каждый раз во время Единого Государственного Экзамена.

Каждый год (а технология ABBYY используется во всех регионах, где проводится ЕГЭ с самого его начала) миллионы результатов тестов выпускников школ обрабатываются за несколько дней. А ведь это выпускники 47 российских регионов! Это очень сложный по организационной и технологической сложности проект. Требования к точности ввода и надежности работы беспрецедентно высоки, ведь от этого зависит дальнейшая судьба выпускника, сможет ли он поступить в ВУЗ.

CNews.ru: Какие вложения требуются для разработки полноценного продукта для чтения машинных форм? Сколько времени это процесс занимает в плане создания новой версии?

Арам Пахчанян: Мы следим за своими технологиями, как хорошие хозяева следят за своим хозяйством: что бы все ножи были острыми, все продукты лежали на своих местах, и все нужное было всегда под рукой. В таком хозяйстве исключаются ситуации, при которых выясняется, что по чьему-то недосмотру в нужный момент чего-то не хватает, что-то лежит непонятно где, что-то не готово и так далее. У нас все и всегда находится в состоянии готовности, всегда все компоненты завершены и все работает. Поэтому когда доходит дело до конкретного продукта, то все находится под рукой, как инструменты, так и персонал. Это потенциал компании, и мы всегда способны быстро удовлетворить требования заказчика. Мы международная компания, у нас пять офисов по всему миру, и мы должны быть способны решить любые задачи, которые могут потребоваться любому клиенту в мире. В ситуации, когда у конкурентов есть неограниченный доступ к финансовым ресурсам, мы поставлены в достаточно тяжелые условия. Кредит нам получить сложнее, помимо этого, мы не публичная компания, а закрытое акционерное общество. В результате нет возможностей быстро найти большие объемы средств. В такой ситуации мы просто обязаны иметь большой багаж в области своих решений, экспертизы и содержать все в полном порядке. У нас это получается.

CNews.ru: Каковы перспективы разработки новых технологий в области машинного чтения? Что может оказаться прорывом в этой области и что для этого необходимо сделать?

Арам Пахчанян: Уже сейчас настал момент, когда для технологии распознавания печатного текста невозможно достичь существенного улучшения качества распознавания. То есть, сколько бы не вносилось изменений, потребительские свойства заметно не улучшатся. Не очень существенно, необходимо исправить один знак на тысячу или на две тысячи слов. На сегодня львиную долю времени и ресурсов при выпуске нового продукта приходиться тратить на решение задач сохранения форматирования исходного текста, определения расположения текста и картинок, сочетания цветов и текста. Именно эти вещи требуют существенных усилий и времени при разработке, а их отсутствие вызывает наибольшее раздражение у пользователя. Следовательно, именно они становятся для нас приоритетными.

Разработка различных сценариев применения здесь оказывает неоценимую помощь — если необходимо распознать журнал, включаются одни механизмы распознавания и сохраняются вполне определенные элементы верстки, если книгу — то совершенно иные. Другие методы должны применяться и для перевода текста в редактор текстов. То есть развитие будет идти по достаточно традиционному пути — сначала создается универсальное решение, а затем решаются узкие задачи, требующие своих методов.

В вопросе распознавания рукописного текста, основная задача стоит в том, чтобы сделать процесс распознавания еще более стабильным, менее зависимым от способов написания, исправлений, и так далее. В нем необходимо значительно уменьшить количество символов, которые требуют дальнейшей верификации, и повысить качество выходной информации. В отличие от многих других технологий, которые существуют уже несколько лет, и все еще не могут нормально работать, нынешняя технология распознавания рукописного текста уже не вызывает раздражения у пользователя. Она достаточно «отполирована» и удобна. И то, что наши продукты нравятся пользователям, я могу приписать не красивому интерфейсу, а качественной работе самой технологии.

CNews.ru: Спасибо.

Вернуться на главную страницу обзора

Версия для печати

Опубликовано в 2003 г.

Техноблог | Форумы | ТВ | Архив
Toolbar | КПК-версия | Подписка на новости  | RSS