Н аучното звено на технологичния гигант, Google Research, демонстрира нов начин за използване на изкуствен интелект за разчитане на почерк, който може радикално да промени начина, по който машините преобразуват написаното на хартия в текст на телефон или компютър.
Системата InkSight трансформира снимки на ръкописни думи в дигитален текст чрез използването на изкуствен интелект без необходимостта от устройства посредници. Целта е да се замени понякога неособено точното оптично разпознаване на символи (старата технология OCR) с изкуствен интелект, който може да имитира начина, по който хората реално се учат да четат – по-конкретно чрез пренаписване на съществуващ текст, за да научи как изглеждат и какво означават цели думи. Това е изисквало от изследователите да обучат изкуствения интелект както да разпознава, така и да имитира човешки почерк.
Мастило
„Дигиталното водене на бележки набира популярност, като предлага дълготраен, лесен за редактиране и индексиране начин за съхранение на бележки в дигитална форма, или т.нар. дигитално мастило. Въпреки това все още съществува значителна разлика между този начин на водене на бележки и традиционното водене на бележки на хартия с писалка - практика, която остава предпочитана от огромното мнозинство“, обясняват изследователите. „Нашият подход комбинира четене и писане, което позволява качествено обучение на модела дори при липсата на големи количества ръкописни примери. Според нас това е първата разработка, която ефективно преобразува почерк от различни снимки, които се отличават по визуални характеристики и лични ръкописни шрифтове“.
Точност
InkSight не е просто алтернативна технология. Тя осигурява по-точни резултати в неидеални условия. Например, ако снимката е направена при слаба светлина, текстът е частично скрит или фонът е объркващ, технологията OCR не би се справила. Изследователите са установили, че хората могат да разпознаят 87% от очертанията на текста, генерирани от InkSight. Две трети от тях били толкова точни, че хората не могли да ги отличат от истински ръкопис.
Практично
Ако обичате да пишете на ръка, InkSight може да предложи значителни предимства. Представете си, че записвате нещо на ръка в хартиен бележник и после го показвате на камерата си, за да го направите незабавно достъпно за търсене и организиране в контекст с предишни бележки. Ако имате особено нечетлив почерк, InkSight може да превърне „йероглифите“ ви в машинописен текст, който отразява точно това, което сте написали. В по-широк мащаб InkSight може да бъде решаващ инструмент за разчитане и цифровизиране на ръкописен текст дори от минали векове. Дори ако текстът е на език без широко цифрово представяне, InkSight може да помогне за запазването на ръкописа и създаването на учебни източници за този език.
Google не е единствената компания, която разработва AI инструменти за разчитане на почерк. Например новият Kindle Scribe на Amazon разширява възможностите на електронния четец за преобразуване на ръкописни бележки в четлив текст. Съществува и приложението GoodNotes, което може да чете ръкописен текст и наскоро въведе инструменти за редактиране на ръкопис, използвайки своята технология GoodNotes Smart Ink, за да превръща ръкописния текст в печатен. Добавените инструменти позволяват редактиране на ръкописни бележки като печатни, включително подравняване на бележките, копиране и поставяне, както и преформатиране на текста за по-логично представяне.
Редакция
Приложението позволява да редактирате ръкописния си текст, както бихте редактирали въведен текст в документ. Това включва подравняване на бележки, копиране и поставяне на части от ръкописа, както и преформатиране на текста, за да стане по-четлив и логичен. Тези възможности се добавят към вече наличните инструменти за проверка на правописа и Word Complete за ръкописен текст. Функцията AI секретар Ask Goodnotes пък позволява да задавате въпроси за съдържанието на бележките си, да получавате резюмета, да получавате обяснения на записани идеи и дори да създавате тестове за проверка на знанията си.
Аритметика
Функцията Math Assist пък е насочена към решаването на ръкописно записани математически уравнения. Math Assist разпознава ръкописни математически задачи и извършва изчисления, за да предложи отговор накрая. Освен това показва стъпките за решаване на задачата, като обхваща всичко – от аритметика до разписване на задачата стъпка по стъпка. Ако не желаете пълния отговор, AI може също да предоставя само подсказки, за да ви позволи сами да решите уравнението.
Деян Дянков