август 12, 2024
Владимир Моисеенко, барнаульский студент и молодой предприниматель родом из села Родино, разработал концепцию уникального в своем роде приложения по работе с китайским языком. Благодаря ему, вводить и переводить иероглифы (а в перспективе, и целые тексты) станет в разы проще. На реализацию этого стартапа молодой ученый выиграл миллион рублей от государства. В чем суть инновационной разработки и зачем она нужна, изобретатель рассказал altapress.ru.
Китайские иероглифы в электронном формате.
unsplash.com
Целевая аудитория, признается Владимир, широкая. Китайский язык прочно входит в нашу жизнь, и все чаще требуется перевести какой-то китайский текст. Здесь его разработка и поможет.
Приложение пригодится как изучающим язык, так и профессиональным переводчикам. И, конечно, простому обывателю, которому нужно узнать, что написано, например, на этикетке.
«У меня есть друг, который занимается ремонтом электросамокатов. Этикетки управляющих блоков там на китайском. К этому языку он вообще отношения не имеет, он инженер. Часто присылает мне фото, просит перевести, чтобы понимать, где какой провод. Есть другой товарищ, которому часто нужна помощь с переводом чертежей. Поэтому инструмент очень востребован».
Распространять приложение будут по модели Free-to-Play — то есть скачать его и пользоваться сможет любой человек совершенно бесплатно. Однако, если нужны большие объемы, понадобится или приобрести подписку, или посмотреть рекламу. Уже есть несколько компаний, с которыми ведутся переговоры о сотрудничестве.
Проект Владимира Моисеенко называется Simple China — буквально «Простой Китай» Он предлагает новый способ работы с иероглифами, который подойдет даже новичку или обывателю.
В цифровую эпоху стандартные способы ввода иероглифов — это рисовать на экране пальцем или вводить латиницей их произношение (пиньинь). И то, и другое — долго и неудобно, особенно для тех, кто ничего не знает о языке.
Подход, разработанный молодым ученым, предлагает совершенно иной путь. За основу он взял визуальный принцип, подсмотрев идею в методе ввода для китайских стенографистов — «Уби» («Пять черт»).
Дело в том, что каждый иероглиф — не случайный набор черточек, а гармоничное сочетание нескольких более маленьких составных частей, каждая из которых несет свой смысл. Эти части называются графемами. На основе комбинирования графем и основан способ — это как собирать конструктор.
«Я разбил все существующие в компьютерной кодировке иероглифы (всего их 7000) на составные части — графемы. Получились свои собственные графемы, всего 450, в скором времени останется около 400. За основу деления взят визуальный принцип, а не смысловой (как это принято в китайском языке). Таким образом, моим набором легко пользоваться даже новичку, совершенно ничего про язык не знающему».
На заметку — пятое издание «Словаря китайских иероглифов и их вариантов» содержит 106 230 иероглифов. Хотя для нормальной жизни в Поднебесной достаточно знать около 2-3,5 тыс.
«Это как кирпичики "Лего". Мы можем собрать из них любой иероглиф, словно из конструктора, — объясняет автор проекта. — Вводим один символ, а программа автоматически выдает на выбор то, что с ним сочетается. Соответственно, на втором шаге выбираем уже не из четырехсот, а из, допустим, ста пятидесяти символов. И так с каждым шагом все меньше».
Первым клиентом стала собственная компания Владимира Моисеенко. Много лет он занимается робототехникой — и, конечно, так как на рынке немало китайских устройств, пришлось знакомиться с языком.
Начав изучать китайский, разработчик задался вопросом — как у них вообще получилось загнать в машинные алгоритмы свою письменность? Будучи человеком на стыке технического образования и китаистики, он смог проследить закономерность — составление иероглифов из графем подчинено строгой логичности. Как и сама грамматика, которая предельно проста.
«Сначала китайский содержал около трехсот основных иероглифов, которые знают все, кто когда-то брался его учить. Затем язык стал формироваться по пути комбинирования этих основных иероглифов. Получился такой монстр Франкенштейна. Однако он очень логичен, и айтишнику оказалось крайне просто его изучать. Как программу пишешь или электрическую схему составляешь», — вспоминает изобретатель.
Впоследствии автор проекта принялся собирать графемы — собственную базу, которая поможет вводить и переводить быстрее. И действительно будет полезной людям. Сначала для себя, как хобби, а затем разработал целую методику.
Есть, конечно, переводчики от Google или Yandex, но с китайским они все еще справляются плохо. Все потому, что у каждого иероглифа есть много значений. Взять тот же 我 (wǒ), который обозначает все формы местоимения «я» разом — и «мне», и «мой», и «меня». Какую выбирать? Машина путается.
«Переводчики используют проверенный сервис bkrs.info, который выдает все значения отдельных иероглифов во фразе, чтобы можно было выбрать нужное и перевести. В комплексе с моей разработкой эта концепция превращается в законченное и полезное приложение», — рассказал собеседник.
Владимир Моисеенко сам пять лет жил в Поднебесной, преподавал там и работал. Занимался бизнесом в сотрудничестве с китайскими компаниями, одна из которых, частично принадлежащая правительству, совместно с ним разрабатывала платежную систему в нацвалютах, без доллара.
Сейчас Владимир обучается в магистратуре института гуманитарных наук АлтГУ по направлению «Образовательное предпринимательство». Это его шестое образование (и пятое высшее). Первые четыре получал параллельно — на физико-техническом факультете в АлтГУ, там же на педагогическом и экономическом. В институте культуры пошел на китайский — учили там тоже преподаватели из АлтГУ.
«Алтайский госуниверситет — это моя Alma mater. Я очень благодарен преподавателям, которые направляли меня тогда и продолжают это делать сейчас: Василию Белозерских, Владимиру Пашневу. Они до сих пор помогают ресурсами и идеями, что очень ценно, — поделился собеседник. — Также сейчас меня очень поддерживает мой научный руководитель, Марина Тырина, подсказывает, как лучше сделать. Директор института, Лариса Нехвядович, тоже не остается в стороне, даже помогла с оформлением документов на получение гранта».
В университете молодой предприниматель совместно с Денисом Козловым, заведующим кафедрой информатики АлтГУ, организовал стартап-лабораторию, чтобы ребята обучались бизнесу. Студенты также помогают с разработкой программ.
Сейчас методика в процессе доработки. В новом семестре начнутся педэксперименты, испытания с реальными людьми — студентами АлтГУ. Также Владимир Моисеенко покажет ноу-хау китайским коллегам — осень он проведет в Цюнтайском педагогическом институте на Хайнане. Мнение носителей крайне важно.
Обещанный миллион от государства попадет к предпринимателю только осенью, после регистрации юрлица. После этого будет окончательно сформирован основной костяк команды проекта. Люди уже нашлись и успели вместе потрудиться — например, они создали приложение в формате виртуальной реальности и показали его на хакатоне. Разработка велась на базе VR-лаборатории АлтГУ.
С командой VR-лаборатории Владимир Моисеенко тесно сотрудничает — они помогают с техническими вопросами в его проектах, он содействует в продвижении их продуктов.
«Что касается конкретных расходов, разработчики уже запросили полмиллиона. И попробуй откажи, — смеется автор проекта. — Нюансов много. Плюс, нужно будет много средств на продажи и поиски альтернативных источников монетизации, учитывая, что некоторые сервисы грозятся закрыть в России. Также буду привлекать инвесторов помимо гранта. Тогда, думаю, денег должно хватить».
Впоследствии разработчик планирует подготовить целую линейку приложений на основе своей идеи — сайт, словарь, игры, тренажеры и т.д., в том числе для детей.
Еще один большой запланированный шаг — создать нейросеть, которая будет по фото распознавать текст. У существующих сервисов, которые это делают, есть определенный процент ошибок — и, например, в инженерии это фатально. Владимир Моисеенко готовится создать инструмент, погрешность которого будет минимальна.
«Помимо этого, сейчас заканчиваю собственный словарь китайского языка на бумаге. Помогает мне в этом партнер — Александр Горбачев, который занимается подготовкой к печати. Там иероглифы расположены не по произношению и не по ключам, как обычно, а по частотности графем. То есть на первых страницах будут самые нужные. Это будет такая настольная книга китаиста».