През 2018 г. Онтотекст се разрастна както като бизнес, така и като технология. Приключваме годината с отлични финасови резултати, но има още по-важни и по-вълнуващи неща, които ни се случиха.
Наблюдаваме по-зряло търсене - потребители, които искат да използват семантичните технологии адекватно, за да решават реални бизнес проблеми. Все по-често получаваме запитавания за лицензи на GraphDB от мултинационални корпорации, които вече са изградили архитектура с изкуствен интелект (ИИ), използващи графи от знания (knowledge graphs) – бази данни свързани в мрежова структура и описани с формална семантика. Те имат ясни технически изисквания, проучили са няколко технологии от различни доставчици и са готови да интегрират една семантична база данни. Последни примери са някои от най-големите производители на автомобили и самолети. Продължаваме да развиваме нашата вертикална експертиза и предложения, за да отговорим по-добре на доказаните от пазара нужди във пазарното разузнаване и здравеопазването.
За да можем да се насочим към нови практически приложения и да увеличим добавената стойност, която предлагаме, интегрирахме нови функционалности в нашите продукти. Пример за това са семантичните вектори за статистически извод, базирани на машинно обучение, и съхранението на документи за управление на много големи обеми метаданни. За да ускорим допълнително научноизследователската и развойната си дейност, ние осигурихме повече от 3 милиона евро външно финансиране.
Това e чудесно начало за нашата нова голяма мисия - да станем основна част от плановете за разработване на изкуствен интелект (ИИ) на Сирма Груп, мажоритарен акционер в Онтотекст. През април 2017 г. Сирма Груп обяви своята Корпоративна стратегия 2022 за ИИ технолгоии за големи предприятия. Амбицията на Сирма е да се превърне във водещ доставчик на интелигентни корпоративни технологии, който да предлага цялостна платформа с изкуствен интелект (SENPAI) и да има капацитета и партньорската екосистема да предлага тези решения навсякъде по света.
По-долу разказвам повече подробности по тези теми, а постът ми включва и илюстрации, изготвени от Диляна Ангелова, графичен дизайнер, които показват нашите корпоративни ценности.
Тази година продължаваме да разширяваме функционалностите на нашата семантична база данни - GraphDB, с нова палитра от възможности.
Една от най-обещаващите функционалности е пакетът Semantic Vectors, интегриран като плъгин за търсене, основано на смислова близост на концепции в графи от знания. Ние хората, определяме подобието между текстове въз основа на сходството на думите, които ги съставят, и когнитивните асоциации и връзки, кодирани в нашия мозък. Сега, този нов плъгин обогатява графи от знания със семантични индекси за сходство, основани на високо мащабируем векторно модел. Този механизъм на представяне, който стана популярен като “вграждане” (embedding), е специален - той се получава чрез техники за машинно обучение, които кодират подобни понятия в математически “подобни” вектори. Благодарение на този плъгин, потребителите могат да правят статистически изводи и да получават повече резултати въз основа на съвпадение на семантично близки концепции.
Друг нов плъгин е интеграцията на GraphDB с MongoDB. MongoDB е базата данни от документи с най-голямата общност от разработчици. Нейните индекси са предназначени за бързо съхранение и извличане на документи и обекти, за разлика от графовите базите данни, които са най-ефективни при анализирането на взаимовръзки, откриването на модели и извеждането на нови факти. Документните бази данни позволяват един по-гъвкав подход към данните и промените в тях, и гарантират по-добра мащабируемост и ефективност при актуализации и извличане на обекти. Важното е, че комбинацията от общ подход и изрично изискване за въвеждане на индекси за конкретни видове заявки, прави MongoDB по-подходяща за много големи набори от данни, документи, анотации и т.н.
GraphDB се доказа през годините като зряла и устойчива система, за критични бизнеса операции на компаниите, които използват най-интензивно знания. С тези нови допълнения към екосистемата от специални индекси и конектори за други системи, GraphDB е готова да служи като централен компонент в много широк спектър от архитектури за управление на корпоративно съдържание и данни, като същевременно се справя ефективно с различни анализи и транзакционни натоварвания. За да обслужваме по-добре целия жизнен цикъл на данните, разработихме и нов механизъм за извличане, трансформиране и зареждане на данни (ETL), базиран на Apache SPARK. Той позволява паралелно, и съотвено хоризонтално скалируемо, събиране, почистване и нормализиране на данните от различни източници. GraphDB вече е готова да обслужва слоя данни в SENPAI.
През годината успешно въведохме в експлоатация методология, основана на подхода Agile. Имплементацията се провеждаше с интензивни обучения на екипа. В резултат на това ефективността на директния персонал се повиши до средна натовареност по проекти (billability) от 80%.
Отработеният процес и стриктните срокове на доставяне доведоха до постигането на годишни приходи от 100 000 евро на продуктивен служител. Това е значително постижение, като се има предвид, че тази средна стойност включва не само техническия и оперативен персонал, но и екипите, занимаващи се с разработването на продукти, научни изследвания и обучения. Подобрената ефективност имаше пряко положително въздействие върху рентабилността и паричния поток.
Услугите предлагани от нашият оперативен екип добавят все по-голяма стойност. През 2018 г. Онтотекст подписа няколко договора, в които поема повече отговорности за управление на цели системи и ИТ функции, вместо да предоставя само техническа поддръжка. Такива предложения включват управлявани услуги за данни и анализи (managed data services), в които ние поемаме отговорността да изпълним ключовите показатели за ефективност (KPI), определени от нуждите на бизнеса. Наред със стандартните оперативни KPI (напр. време за реакция и наличност на услугата), тези управлявани услуги включват гаранции за качество на данните и точност на текстовия анализ в специално пригодени информационни архитектури, които се актуализират с нови данни, идващи от множество външни източници. Пример за това са графи знания от фирмени данни, която интегрира и свързва данни от 5 различни доставчици на данни.
С по-зрялото проектно управление и оперативен капацитет успяхме да подобрим удовлетвореността на нашите клиенти и служители, както и предвидимостта на проектите. Нашата амбиция е да продължим да подобряваме своята ефективност и през следващата година.
През ноември 2018 г. отбелязахме важно събитие в нашето сътрудничество с Fujitsu – 7-мият в света доставчик на ИТ услуги и №1 в Япония. Fujitsu използва ГрафДБ за изготвянето на проекти за Министерството на вътрешните работи на Испания в областта на националната сигурност. След InfoSys, Atos Origin и NTT Data, това е четвъртата компания от топ 10 на световните доставчиците на ИТ услуги, която ще използва технология на Онтотекст за своята платформа с изкуствен интелект.
Партньорството с глобални доставчици на ИТ услуги, консултанти и системни интегратори е ключова за стратегията на Онтотекст и Сирма за развитие и предоставяне на бизнес решения на големи предприятия и правителства по целия свят.
През 2018 г. четири проектни предложения, с участие на Онтотекст, получиха финансиране от Европейската комисия. Общата стойност на финасирането за Онтотекст е €1.8M. Два от проектите вече се изпълняват. Първият е CIMA (Интелигентно свързване на данни за компании от различни източници) и се фокусира върху хармонизирането на данни посредством семантично представяне и интеграция. В този проект също така ще бъдат разработени методи за семантично съответствие, свързване и извличане на концепции. Вторият проект, WeVerify (Wider and Enhanced Verification for You) цели да се разкрие фалшиво съдържание с помощта на кросмодална проверка, анализ на социалните мрежи, микротаргетирано разобличаване и блокчейн технология, използваща база данни с известни фалшификати.
Два нови проекта предстои да стартират през януари 2019 г. EXA MODE (EXtreme-scale Analytics via Multimodal Ontology Discovery & Enhancement) е проект за обработване на големи масиви от данни (т.нар. big data) в областта на здравеопазването. Той включва разработване на прецизни аналитични методи и инструменти за взимане на решения в болниците. От друга страна, InnoRate (Data-driven tools for supporting and improving the decision-making processes of investors for financing innovative SMEs), има амбицията да промени финансовия сектор в Европа, който до голяма степен не е склонен да поема рискове, и така да увеличи иновационния капацитет сектор с голям потенциал за растеж и на малките и средни предприятия (МСП).
TRR (Tracking of Research Results) е друг проект с участието на Онтотекст, който започна през октомври. Това не е изследователски проект, но има пряко отношение към няколко изследователски проекта. Проектът цели да даде възможност на създателите на политики в областта на научните изследвания и иновациите по-добре да извличат, анализират и разпространяват резултатите и въздействията от финансираните научни изследвания. Проектът включва идентифициране и проследяване на информация за резултатите от изследванията, нови продукти, базирани на тях, изобретатели и патенти, както и стартъпи и компании, които ги използват. Тези анализи подават сигнали, които са необходими на инвеститорите и M&A консултантите за да разширят своите модели за оценка.
С всички тези проекти финансирането, осигурено за подкрепа на стратегическите планове за научноизследователска и развойна дейност на Онтотекст, възлиза на обща стойност 3.1 М € за 2018 г. и следващите години. Финансирането се разпределя по стратегически вертикали, както следва: 1,9 М € за пазарно разузнаване и издатели и 1,2 М € за здравеопазване и науки за живота. Това ще подпомогне развитието на вертикални модели на знания и специфични приложения за корпоративната ИИ платформа SENPAI.
Историята обича циклите. Сирма Груп е създадена през 1992 г. като Сирма Ей Ай ООД (Sirma AI Ltd.). Преди четвърт век ние разработихме няколко експертни системи за държавни институции в Канада и други страни. Например експертни системи, основаващи се на Boolean Constraints Propagation Networks за данъчни консултации и за известяване на населението в случаи на екологични кризи и замърсявания. В средата на деветдесетте години на 20 век обаче, темата за изкуствения интелект излезе от мода. Маркетинговите екипи на множество агресивни стартъпи раздуха очакванията до степен, която технологията все още не беше готова да догони. Сирма диверсифицира бизнеса си и днес е една от най-големите ИТ групи в България. Акциите на компанията се търгуват на БФБ с борсов тикер SKK:BLG.
Основах Онтотекст през 2000 г. като лаборатория за научноизследователска и развойна дейност в Сирма, а през 2008 г. я обособихме в самостоятелна компания, за да привлечем финансиране за продуктизиране на семантичните технологии. По-късно отношението към ИИ отново се промени. През последните години ИИ технологите се развиха и доказват своя потенциал за революционизирането на различни индустрии. В същото време, повечето от технологичните доставчици са насочени към потребителски приложения, например към интелигентни домашни помощници, а не към подобряване на ефективността на предприятията. Сирма идентифицира тази възможност и разработи своята Корпоративна стратегия 2022 насочена към превръщането на съвременните организации в интелигенти предприятия (enterprise AI).
Онтотекст има централна роля в плановете на Сирма – като продукти, ноу-хау в разработването и маркетинга на водещи в световен мащаб технологии, капацитет за научноизследователска и развойна дейност и постиженията в осъществяването на корпоративни ИИ проекти. Следвайки своята корпоративна стратегия, Сирма Груп закупи акциите, които фондът NEVEQ имаше в Онтотекст. Сирма Груп също така стартира вторично предлагане на акции (SPO), за да набере допълнително финасиране за изпълнение на развитието на платформата SENPAI и да подпомогне разрастването на бизнеса.
Като следваща стъпка в този процес Сирма ще консолидира капацитета за научноизследователска и развойна дейност и интелектуалната собственост на групата, свързана с ИИ. Планът включва сливане на Онтотекст в Сирма Ей Ай АД (Sirma AI) – дружество изцяло притежавано от Сирма Груп. До края на 2018 г. Онтотекст ще се влее в Сирма Ей Ай като цялостно бизнес предприятие, включително управлението, персонала, договорите и задълженията му. Сирма Ей Ай ще доразвие GraphDB и платформата на Онтотекст и ще развие платформата SENPAI около тях. За мен ще бъде чест да бъда изпълнителен директор на Сирма Ей Ай.
В продължение на 18 години Онтотекст е изпълни пълния цикъл на иновации около идеята за използване на големи графи знания за текстов анализ, свързване на данни и анализ на информация. Участвахме в повече от 30 изследователски проекта и написахме стотици научни статии, които са цитарани хиляди пъти. Създадохме изобретения и привлякохме финансирането от фондове за рисков капитал. Усъвършенствахме продуктите си в стабилна корпоративна ИТ инфраструктура, работеща в критични за бизнеса системи. И, последно, доказахме, че тази технология е търговски жизнеспособна - създадохме бизнес модел, който позволява на Онтотекст да расте и да бъде печеливша, конкурентна и устойчива.
Време е да минем на следващото ниво – да развием Онтотекст и Сирма като голям технологичен доставчик, който има капацитет да създава мащабни корпоративни платформи с ИИ и ги имплементира в цял свят. Нека си пожелаем късмет, смели сърца и хладен ум!
бул. "Цариградско Шосе" №135, 1784 София, България тел: +359-2-976-8310
202 N 9th St, Suite 201B, Boise, ID 83702, USA Tel: (800) 701-3710 ext. 101
© Sirma Group 2018
Привет !
Мога да отговарям на въпроси като:
Кои са в борда на Сирма?
Кой е Цветан Алексиев?
Виж Помощ за още примери
We are using your personal data to improve your browsing experience on our site. To find out more or to opt-out, please read our Privacy Policy.
By choosing I Accept, you consent to our Privacy Policy.