Вивчення основ штучного інтелекту при створенні голосового асистенту

Анотація

(ua) В статті розглядаються персональні цифрові помічники. Вирішувати повсякденні завдання допомагає галузь штучного інтелекту. Масове впровадження штучного інтелекту у повсякденне життя користувачів сприяє переходу на голосові програми.Голосові асистенти можуть виконувати різноманітні дії після того, як почули слово або команду пробудження. Вони можуть вмикати світло, відповідати на запитання, відтворювати музику, робити онлайн-замовлення тощо.Авторами статті, розроблений голосовий асистент, розпізнає й синтезує мову. Голосовий помічник може в режимі реального часу аналізувати запит клієнта і відтворювати попередньо записані репліки, надає можливість мінімізувати дію руками для перегляду контенту в інтернеті.Студенти Центральноукраїнського державного університету імені Володимира Винниченка спільно зі студентами-іноземцями Донецького національного медичного університету розв’язували задачі зі штучного інтелекту з використанням мови програмування. В результаті роботи створений голосовий україномовний бот, який запускається на персональному комп’ютері і його можна використовувати, як приклад програмування в навчальному процесі.Для створення голосового помічника використовували малу модель на 50 Мб, для того, щоб він більш швидше розпізнавав мову та реагував на команди оперативніше. Текст мовлення TTS працює з персональними цифровими пристроями. Голос TTS генерується комп’ютером. Якість розмовного голосу залежить від мовного механізму, але деякі голоси звучать як людські. В нашому випадку це голос модулю Torch з єдиним українським спікером 'mykyta_v2'.Для розуміння та розпізнавання української мови користувача, використали модуль vosk, для обробки, та sounddevice для ретрансляції.Розробили функцію виклику голосового асистента із фонового режиму на своє ім’я, фільтрацію голосового трафіку, орієнтацію по функціоналу помічника.Дана програма пройшла апробацію студентами-іноземцями Донецького національного медичного університету під час практичних занять з медичної інформатики для виведення на екран статей медичного словника.
(en) The article discusses personal digital assistants and the basics of artificial intelligence when creating a voice assistant. The field of artificial intelligence helps solve everyday tasks. The massive introduction of artificial intelligence into the everyday life of users is contributing to the transition to voice applications. Voice assistants can perform a variety of actions after hearing a wake-up word or command. They can turn on lights, answer questions, play music, make online orders, and more.The voice assistant developed by the authors of the article recognizes and synthesizes speech. The voice assistant can analyze the client's request in real time and play pre-recorded lines, providing an opportunity to minimize manual action for viewing content on the Internet.Students of the Central Ukrainian State University named after Volodymyr Vinnichenko, together with foreign students of the Donetsk National Medical University, solved problems in artificial intelligence using a programming language. As a result of the work, a Ukrainian-speaking voice bot was created, which is launched on a personal computer and can be used as an example of programming in the educational process. To create a voice assistant, we used a small model of 50 MB, in order for it to recognize speech more quickly and respond to commands more quickly.The text of speech TTS works with personal digital devices. The TTS voice is generated by a computer. The quality of a spoken voice depends on the language mechanism, but some voices sound human. In our case, this is the voice of the Torch module with the only Ukrainian speaker 'mykyta_v2'.They used vosk modules for processing and recognizing the Ukrainian language and sound device for relaying what the assistant hears into text.We have developed the function of calling the voice assistant from the background mode to his name, voice traffic filtering and guidance on the functionality of the assistant. This assistant program was tested by foreign students of the Donetsk National Medical University in practical classes with medical information to display medical dictionary articles.

Опис

Ключові слова

заклад вищої освіти, цифровий помічник, голосовий асистент, штучний інтелект, бот, institution of higher education, digital assistant, artificial intelligence, voice assistant, bot

Бібліографічний опис

Болілий В. О. Вивчення основ штучного інтелекту при створенні голосового асистенту / Василь Олександрович Болілий, Людмила Павлівна Суховірська, Самі Абуватфа // Наукові записки ЦДУ. Серія: Педагогічні науки : зб. наук. праць / МОН України, Центральноукр. держ. ун-т ім. В. Винниченка. - Кропивницький, 2023. - Вип. 211. – С. 89-94.