Publications

2018 year
  • Hlavac M.

    LipsID // Student scientific conference FAV 2018 - 2018 // UWB Student scientific conference FAV 2018 - 2018, pp. 31-32

  • Копеев К., Столбов М.Б.

    Обработка аудиосигналов с использованием двухэлементной микрофонной решетки с поперечной архитектурой//Сборник тезисов докладов конгресса молодых ученых. Электронное издание [Электронный ресурс]. - Режим доступа: http://openbooks.ifmo.ru/ru/file/7830/7830.pdf, своб. - 2018

  • Иванько Д.В.

    Использование системы распознавания лиц для осуществления покупок в мобильных устройствах и веб-приложениях // Научно-технический вестник информационных технологий, механики и оптики - 2018. - Т. 18. - № 3(115). - С. 457-461 More

  • Kaliyev A., Kaziyeva N., Rybin S.V., Matveev Y.N., Бурамбаева Н.А.

    Modeling pause for the synthesis of Kazakh speech // Proceedings of the The International Conference on Engineering & MIS 2018 - 2018, Vol. 1, No. 1, pp. 861-868 More

  • Кухарев Г.А., Казиева Н., Цымбал Д.А.

    Технологии штрихового кодирования для задач лицевой биометрии: современное состояние и новые решения // Научно-технический вестник информационных технологий, механики и оптики - 2018. - Т. 18. - № 1(113). - С. 72-86 More

  • Verkholiak O.V., Karpov A.

    Combined Feature Representation for Emotion Classification from Russian Speech // Communications in Computer and Information Science - 2018, Vol. 789, pp. 68-73 More

  • Sholokhov A., Sahidullah M., Kinnunen T.

    Semi-supervised speech activity detection with an application to automatic speaker verification // Computer Speech and Language - 2018, Vol. 47, pp. 132-156 More

  • Yudin D., Zeno B.

    Event Recognition on Images by Fine-Tuning of Deep Neural Networks // Advances in Intelligent Systems and Computing - 2018, Vol. 679, pp. 479-487 More

  • Markovnikov N., Kipyatkova I., Karpov A., Filchenkov A.

    Deep neural networks in Russian speech recognition // Communications in Computer and Information Science - 2018, Vol. 789, pp. 54-67 More

  • Pugachev A., Akhtiamov O., Karpov A., Minker W.

    Deep Learning for Acoustic Addressee Detection in Spoken Dialogue Systems // Communications in Computer and Information Science - 2018, Vol. 789, pp. 45-53 More

  • Korenevsky M.L., Matveev Y.N., Yakovlev A.V.

    Investigation and Development of Methods for Improving Robustness of Automatic Speech Recognition Algorithms in Complex Acoustic Environments // Proceedings of the Scientific-Practical Conference "Research and Development - 2016" - 2018, pp. 11-20 More

2017 year
  • Medennikov I., Romanenko A., Prudnikov A., Mendelev V., Khokhlov Y.Y., Korenevsky M., Tomashenko N., Zatvornitskiy A.

    Acoustic Modeling In The STC Keyword Search System For OpenKWS 2016 Evaluation // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2017, Vol. 10458, pp. 76-86 More

  • Фельдина Е.А.

    ГРАФОВОЕ ПРЕДСТАВЛЕНИЕ ИЕРАРХИЧЕСКОЙ СТРУКТУРЫ СЦЕНАРИЯ ДИАЛОГА // Сборник трудов VI Всероссийского конгресса молодых ученых (Санкт-Петербург, 2017 г.) - 2017. - С. 227-230 More

  • Фельдина Е.А., Черных И.А.

    Графовое представление иерархической структуры сценария диалога//Сборник тезисов докладов конгресса молодых ученых. Электронное издание [Электронный ресурс]. - Режим доступа: http://openbooks.ifmo.ru/ru/file/6145/6145.pdf, своб - 2017

  • Убский Д.С.

    Автоматическое распознавание эмоций по многомодальным данным // Сборник трудов VI Всероссийского конгресса молодых ученых (Санкт-Петербург, 2017 г.) - 2017. - С. 225-227 More

  • Лаврентьева Г.М.

    Методы детектирования атак на голосовые биометрические систему с целью взлома // Сборник работ аспирантов Университета ИТМО, победителей конкурса грантов Правительства Санкт-Петербурга - 2017. - С. 129-134 More

  • Алексеев А.А.

    Обучение на трехмерных моделях при асимметричном распознавании // Альманах научных работ молодых ученых Университета ИТМО - 2017. - Т. 1. - С. 1-3 - 2017

  • Лисицкий Е.И., Шуранов Е.В.

    Обзор библиотек для ускорения разработки программ для многопоточной обработки данных на языке C++//Сборник тезисов докладов конгресса молодых ученых. Электронное издание [Электронный ресурс]. - Режим доступа: http://openbooks.ifmo.ru/ru/file/6165/6165.pdf, своб. - 2017. - С. 1-2

  • Матвеев Ю.Н., Шуранов Е.В., Авдеева А.С., Щемелинин В.Л., Крылова Е.В.

    Cистема автоматического определения местоположения объектов на основе акустических данных // Всероссийская научная конференция по проблемам управления в технических системах - 2017. - № 1. - С. 313-315

  • Кабаров В.И., Тепляков А.В., Кассу А.М.

    Проблемы макрокомпилятивного синтеза в современных прикладных задачах//Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО - 2017

  • Кабаров В.И., Черных И.А., Левин К.Е., Петров О.Е.

    Построение глобального обратного поискового индекса по массиву речевых данных//Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО - 2017

  • Черных И.А., Петров О.Е., Кабаров В.И.

    Построение глобального обратного поискового индекса по массиву речевых данных // Сборник трудов VI Всероссийского конгресса молодых ученых (Санкт-Петербург, 2017 г.) - 2017. - С. 255-261 More

  • Matveev Y.N., Shuranov E.V., Avdeeva A.S., Shchemelinin V.L., Krylova E.V.

    Acoustic data based automatic object detection system // Proceedings of 2017 IEEE 2nd International Conference on Control in Technical Systems, CTS 2017 - 2017, pp. 301-303 More

  • Матвеев Ю.Н., Рыбин С.В.

    Методические указания по выполнению лабораторных работ по курсу «Синтез речи» - 2017

  • Smirnov E., Melnikov A., Novoselov S., Luckyanets E., Lavrentyeva G.

    Doppelganger Mining for Face Representation Learning // IEEE International Conference on Computer Vision Workshops (ICCVW 2017) - 2017, pp. 1916-1923 More

  • Алсуфьев А.А., Былецкий Д.А., Кабаров В.И.

    Каталог Linguistic Data Consortium: обзор русскоязычных речевых баз данных // Сборник трудов VI Всероссийского конгресса молодых ученых (Санкт-Петербург, 2017 г.) - 2017. - С. 12-14 More

  • Столбов М.Б., Копеев К.

    Разработка алгоритма для приема широкополосного сигнала и подавления широкополосной помехи в 2-микрофонной решетке // Сборник трудов VI Всероссийского конгресса молодых ученых - 2017. - С. 107-110

  • Ryumin D., Karpov A.

    Parametric representation of the speaker’s lips for multimodal sign language and speech recognition // International Archives of the Photogrammetry Remote Sensing and Spatial Information Sciences - 2017, Vol. 42-2, No. 4, pp. 155-161 More

  • Столбов М.Б., Алейник С.В., Копеев К.

    Обработка речевых сигналов в микрофонных решетках, использующих методы многоканального выравнивания и пост-фильтрации Зелинского // Альманах научных работ молодых ученых Университета ИТМО - 2017. - Т. 3. - С. 7-10

  • Щемелинин В.Л., Лаврентьева Г.М., Алсуфьев А.А., Новоселов С.А.

    Метод повышения эффективности идентификации диктора за счет использования мультисессионных голосовых моделей // Альманах научных работ молодых ученых Университета ИТМО - 2017. - Т. 3. - С. 223-226 More

  • Алсуфьев А.А., Былецкий Д.А., Старикова Е.Г., Кабаров В.И.

    Создание мультисессионных речевых баз данных для целей идентификации и верификации диктора // Альманах научных работ молодых ученых Университета ИТМО - 2017. - Т. 3. - С. 15-18 More

  • Malykh E., Novoselov S., Kudashev O.

    On residual cnn in text-dependent speaker verification task // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2017, Vol. 10458, pp. 593-601 More

  • Шулипа А.К., Шолохов А.В.

    Калибровка выходных оценок систем распознавания личностей по голосу // Альманах научных работ молодых ученых Университета ИТМО - 2017. - Т. 3. - С. 221-223 More

  • Лаврентьева Г.М., Матвеев Ю.Н., Щемелинин В.Л.

    Разработка технологии автоматической бимодальной верификации по лицу и голосу с защитой от использования подложных биометрических образцов // Альманах научных работ молодых ученых Университета ИТМО - 2017. - Т. 4. - С. 4-8 More

  • Затворницкий А.П., Нугманова А.А.

    Сравнительный анализ алгоритмов классификации и форм представлений для решения задачи автоматического анализа тональности коротких текстов//Сборник тезисов докладов конгресса молодых ученых (VI Всероссийский конгресс молодых ученых, 18-21 апреля 2017 г.). Электронное издание - 2017

  • Нугманова А.А.

    Анализ тональности коротких текстов // Альманах научных работ молодых ученых Университета ИТМО - 2017. - Т. 4. - С. 294-297 More

  • Kaya H., Karpov A.A.

    Introducing Weighted Kernel Classifiers for Handling Imbalanced Paralinguistic Corpora: Snoring, Addressee and Cold // Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH - 2017, pp. 3527-3531 More

  • Akhtiamov O., Sidorov M., Karpov A., Minker W.

    Speech and text analysis for multimodal addressee detection in human-human-computer interaction // Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH - 2017, pp. 2521-2525 More

  • Shulipa A., Sholokhov A., Matveev Y.

    Clustering Target Speaker On A Set Of Telephone Dialogs // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2017, Vol. 10458, pp. 244-252 More

  • Волкова С.С., Матвеев Ю.Н.

    Применение сверточных нейронных сетей для решения задачи противодействия атаке спуфинга в системах лицевой биометрии // Научно-технический вестник информационных технологий, механики и оптики - 2017. - Т. 17. - № 4(110). - С. 702–710 More

  • Kaya H., Ali Salah A., Karpov A., Frolova O., Grigorev A., Lyakso E.

    Emotion, age, and gender classification in children’s speech by humans and machines // Computer Speech and Language - 2017, Vol. 46, pp. 268-283 More

  • Убский Д.С., Менделев В.С.

    Распознавание эмоций в речи на основе слияния нейронных сетей//Сборник тезисов докладов VI Всероссийского конгресса молодых ученых. Электронное издание - 2017. - Режим доступа: http://openbooks.ifmo.ru/ru/file/6160/6160.pdf, своб. - 2017

  • Пугачев А.А., Карпов А.А.

    Глубокая нейронная сеть для определения обращения человека к автоматической диалоговой системе//Сборник тезисов докладов VI Всероссийского конгресса молодых ученых. Электронное издание. - СПб: Университет ИТМО, 2017. - Режим доступа: http://openbooks.ifmo.ru/ru/file/6149/6149.pdf, своб. - 2017

  • Полухин Д.Д., Рыбин С.В.

    Применение суффиксных деревьев для поиска оптимальной последовательности звуковых элементов на основе алгоритма Витерби//Сборник тезисов докладов VI Всероссийского конгресса молодых ученых. Электронное издание. - СПб: Университет ИТМО, 2017. - Режим доступа: http://openbooks.ifmo.ru/ru/file/6157/6157.pdf, своб. - 2017

  • Нугманова А.А., Затворницкий А.П.

    Сравнительный анализ алгоритмов классификации и форм представлений для решения задачи автоматического анализа тональности коротких текстов//Сборник тезисов докладов VI Всероссийского конгресса молодых ученых. Электронное издание. - 2017. - Режим доступа: http://openbooks.ifmo.ru/ru/file/6158/6158.pdf, своб. - 2017

  • Данилов А.А., Затворницкий А.П.

    Исследование возможностей использования записей сервиса YouTube для подготовки языковых и акустических моделей систем распознавания речи//Сборник тезисов докладов VI Всероссийского конгресса молодых ученых. Электронное издание. - 2017. - С. http://openbooks.ifmo.ru/ru/file/6161/6161.pdf

  • Верхоляк О.В., Карпов А.А.

    Анализ влияния интонационных контуров на точность распознавания эмоциональных состояний на базе данных русской эмоциональной речи Ruslana//Сборник тезисов докладов VI Всероссийского конгресса молодых ученых. Электронное издание - 2017. - С. http://openbooks.ifmo.ru/ru/file/6150/6150.pdf

  • Акимушкин В.А., Поздняков С.Н., Чухнов А.С., Рыбин С.В.

    Лабораторные работы в структуре продуктивного обучения математике студентов технических вузов // Инженерное образование - 2017. - № 21. - С. 133-139 More

  • Korenevsky M.L.

    Phase term modeling for enhanced feature-space VTS // Speech Communication - 2017, Vol. 89, pp. 84-91 More

  • Кавчук Д.А., Матвеев Ю.Н.

    Автоматический анализ защищенности информационных систем без использования формальных спецификаций // Научно-технический вестник информационных технологий, механики и оптики - 2017. - Т. 17. - № 3(109). - С. 431–438 More

  • Hrdlicka J., Hlavac M.

    Poker Cards Recognition using Neural Networks // Student scientific conference FAV 2017 - 2017, pp. 30-31 More

  • Gruber I.

    Shooting Target Detection using Particle Filters // Student scientific conference FAV 2017 - 2017, pp. 43-44 More

  • Калиев А.

    Метод автоматической расстановки пауз для казахского языка // Научно-технический вестник информационных технологий, механики и оптики - 2017. - Т. 17. - № 4(110). - С. 749-752 More

  • Лукьянец Е.А.

    Разработка утилиты, позволяющей определить качество работы программной системы, осуществляющей идентификацию лиц в видеопотоке//Сборник тезисов докладов конгресса молодых ученых. Электронное издание [Электронный ресурс]. - Режим доступа: http://openbooks.ifmo.ru/ru/file/6151/6151.pdf, своб. - 2017

  • Kryuchkov B., Syrkin L., Usov V., Ivanko D., Ivanko D.

    Using Augmentative and Alternative Communication for Human-Robot Interaction during Maintaining Habitability of a Lunar Base // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2017, Vol. 10459, pp. 95-104 More

  • Рюмин Д.А., Иванько Д.

    Параметрическое представление области губ диктора для многомодального распознавания жестового языка и речи//Сборник тезисов докладов конгресса молодых ученых (VI Всероссийский конгресс молодых ученых, 18-21апреля 2017г.). Электронное издание - 2017

  • Рюмин Д.А., Иванько Д.

    Разработка усовершенствованного метода аудиовизуального распознавания речи на основе вероятностных моделей акустических и визуальных единиц речи//Сборник тезисов докладов конгресса молодых ученых (VI Всероссийский конгресс молодых ученых, 18-21апреля 2017г.). Электронное издание - 2017

  • Lavrentyeva G., Novoselov S., Malykh E., Козлов А.В., Kudashev O., Shchemelinin V.

    Audio replay attack detection with deep learning frameworks // Proc. 18th Annual Conference of the International Speech Communication Association, INTERSPEECH 2017; Stockholm; Sweden; 20-24 August 2017 - 2017, pp. 82-86 More

  • Lavrentyeva G., Novoselov S., Malykh E., Kozlov A., Kudashev O., Shchemelinin V.

    Audio-replay attack detection countermeasures // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2017, Vol. 10458, pp. 171-181 More

  • Kaliyev A., Rybin S.V., Matveev Y.N.

    The Pausing Method Based on Brown Clustering and Word Embedding // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2017, Vol. 10458, pp. 741-747 More

  • Akhtiamov O., Ubskii D., Feldina E., Pugachev A., Karpov A., Minker W.

    Are you addressing me? Multimodal addressee detection in human-human-computer conversations // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2017, Vol. 10458, pp. 152–161 More

  • Ryumin D., Karpov A.A.

    Towards Automatic Recognition of Sign Language Gestures Using Kinect 2.0 // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2017, Vol. 10278, pp. 89-101 More

  • Luckyanets E., Melnikov A., Kudashev O., Novoselov S., Lavrentyeva G.

    Bimodal Anti-Spoofing System for Mobile Security // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2017, Vol. 10458, pp. 211-220 More

  • Хижняков Д.В.

    Анализ методов ускорения процессов обмена данными между мобильным приложением и векторным сопроцессором мобильного устройства // Сборник тезисов докладов конгресса молодых ученых (VI Всероссийский конгресс молодых ученых, 18-21 апреля 2017 г.). Электронное издание - 2017. - С. 1 More

  • Khokhlov Y.-., Medennikov I., Romanenko A., Mendelev V., Korenevsky M., Prudnikov A., Tomashenko N., Zatvornitsky A.

    The STC Keyword Search System For OpenKWS 2016 Evaluation // Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH - 2017, pp. 3602-3606 More

  • Khokhlov Y.-., Tomashenko N., Medennikov I., Romanenko A.

    Fast and Accurate OOV Decoder on High-Level Features // Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH - 2017, pp. 2884-2888 More

  • Рюмин Д.А., Иванько Д.

    Разработка усовершенствованного метода аудиовизуального распознавания речи на основе вероятностных моделей акустических и визуальных единиц речи // Сборник тезисов докладов конгресса молодых ученых (VI Всероссийский конгресс молодых ученых, 18-21 апреля 2017 г.). Электронное издание - 2017 More

  • Рюмин Д.А., Иванько Д.

    Параметрическое представление области губ диктора для многомодального распознавания жестового языка и речи // Сборник тезисов докладов конгресса молодых ученых (VI Всероссийский конгресс молодых ученых, 18-21 апреля 2017 г.). Электронное издание - 2017 More

  • Хижняков Д.В., Затворницкий А.П.

    Анализ возможного ускорения системы распознавания речи на мобильных устройствах путем использования векторных сопроцессоров // Альманах научных работ молодых ученых Университета ИТМО - 2017. - Т. 1. - С. 171-173

  • Романенко А.Н.

    Использование фрагментов слов для повышения качества поиска токенов, не содержащихся в словаре // Альманах научных работ молодых ученых Университета ИТМО - 2017. - Т. 5. - С. 113-116 More

  • Романенко А.Н.

    Повышение качества поиска токенов, не содержащихся в словаре распознавания//Сборник тезисов докладов конгресса молодых ученых. Электронное издание [Электронный ресурс]. - 2017

  • Иванько Д.В.

    Исследование рабочих характеристик базовых алгоритмов распознавания лиц в условиях клиент-серверной веб-архитектуры и ограниченности ресурсов//Сборник тезисов докладов конгресса молодых ученых. Электронное издание [Электронный ресурс]. - Режим доступа:http://openbooks.ifmo.ru/ru/file/6141/6141.pdf, своб. - 2017

  • Ivanko D., Karpov A., Ryumin D., Kipyatkova I., Saveliev A., Budkov V., Ivanko D., Zelezny M.

    Using a High-Speed Video Camera for Robust Audio-Visual Speech Recognition in Acoustically Noisy Conditions // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2017, Vol. 10458, pp. 757-766 More

  • Баландин М.А., Кудашев О.Ю.

    Алгоритм трекинга биометрически значимых точек лица на видео для мобильных устройств // Сборник тезисов докладов конгресса молодых ученых (VI Всероссийский конгресс молодых ученых, 18-21 апреля 2017 г.). Электронное издание - 2017. - С. 1 More

  • Убский Д.С., Менделев В.С.

    Распознавание эмоций в речи на основе слияния нейронных сетей // Сборник тезисов докладов конгресса молодых ученых (VI Всероссийский конгресс молодых ученых, 18-21 апреля 2017 г.). Электронное издание - 2017. - С. 1 More

  • Нугманова А.А., Затворницкий А.П.

    Сравнительный анализ алгоритмов классификации и форм представлений для решения задачи автоматического анализа тональности коротких текстов // Сборник тезисов докладов конгресса молодых ученых (VI Всероссийский конгресс молодых ученых, 18-21 апреля 2017 г.). Электронное издание - 2017. - С. 1 More

  • Калиев А., Матвеев Ю.Н., Рыбин С.В.

    Анализ методов глубокого машинного обучения для синтеза интонационной речи // Альманах научных работ молодых ученых Университета ИТМО - 2017. - Т. 3. - С. 27-29 More

  • Калиев А., Матвеев Ю.Н.

    Обзор синтеза эмоциональной речи // Сборник тезисов докладов конгресса молодых ученых (VI Всероссийский конгресс молодых ученых, 18-21 апреля 2017 г.). Электронное издание - 2017. - С. 1 More

  • Алсуфьев А.А., Былецкий Д.А., Кабаров В.И., Матвеев Ю.Н.

    Русскоязычные речевые базы данных в каталоге Linguistic Data Consortium//Сборник тезисов докладов VI конгресса молодых ученых. Электронное издание. - СПб, Университет ИТМО - 2017

  • Лаврентьева Г.М., Кудашев О.Ю., Щемелинин В.Л.

    Методы автоматического детектирования спуфинг атак воспроизведения на голосовые биометрические системы//Сборник тезисов докладов конгресса молодых ученых. Электронное издание [Электронный ресурс]. - Режим доступа: http://openbooks.ifmo.ru/ru/file/6153/6153.pdf, своб - 2017

  • Gruber I., Hlavac M., Zelezny M., Karpov A.

    Facing Face Recognition with ResNet: Round One // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2017, Vol. 10459, pp. 67-74 More

  • Hlavac M., Gruber I., Zelezny M., Karpov A.

    Semi-automatic Facial Key-point Dataset Creation // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2017, Vol. 10458, pp. 662–668 More

  • Олейник А.Л.

    Моделирование взаимосвязи между модальностями для решения задач обработки аудиовизуальной речи // Сборник тезисов докладов конгресса молодых ученых (VI Всероссийский конгресс молодых ученых, 18-21 апреля 2017 г.). Электронное издание - 2017. - С. 3 More

  • Копеев К., Столбов М.Б.

    Разработка алгоритма для приема широкополосного сигнала и подавления широкополосной помехи в 2-микрофонной решетке//Сборник тезисов докладов конгресса молодых ученых. Электронное издание [Электронный ресурс]. - Режим доступа: http://openbooks.ifmo.ru/ru/file/6167/6167.pdf, своб. - 2017

  • Prisyach T., Mendelev V.S., Ubskiy D.

    Data augmentation for training of noise robust acoustic models // Communications in Computer and Information Science - 2017, Vol. 661, pp. 17-25 More

  • Lavrentyeva G., Novoselov S., Simonchik K.

    Anti-spoofing methods for automatic speaker verification system // Communications in Computer and Information Science - 2017, Vol. 661, pp. 172-184 More

  • Баландин М.А.

    Сравнение алгоритмов поиска биометрически значимых точек лица // Альманах научных работ молодых ученых Университета ИТМО - 2017. - Т. 1. - С. 108-109 More

  • Верхоляк О.В.

    Экспериментальные результаты сравнительного анализа классификаторов для распознавания эмоций на базе данных эмоциональной русской речи Ruslana // Альманах научных работ молодых ученых Университета ИТМО - 2017. - Т. 1. - С. 235-236 More

  • Верхоляк О.В.

    Анализ классификаторов для автоматического распознавания эмоциональных состояний диктора по речевым характеристикам // Научные работы участников конкурса "Молодые ученые Университета ИТМО" 2016 года - 2017. - С. 00

  • Галюк В.Е.

    Алгоритм восстановления клиппированного речевого сигнала // Научные работы участников конкурса "Молодые ученые Университета ИТМО" 2016 года - 2017. - С. 270-276

  • Галюк В.Е.

    Алгоритмы деклиппирования для улучшения разборчивости речи основанные на анализе спектра // Альманах научных работ молодых ученых Университета ИТМО - 2017. - Т. 1. - С. 276-280

  • Пугачев А.А.

    Глубокая нейронная сеть для детектирования обращения человека к системе в автоматической диалоговой системе // Альманах научных работ молодых ученых Университета ИТМО - 2017. - Т. 5. - С. 88-90 More

  • Лисицкий Е.И.

    Проектирование и реализация мобильного приложения для сбора речевых баз в разных акустических условиях // Альманах научных работ молодых ученых Университета ИТМО - 2017. - Т. 1. - С. 77-80

  • Лисицкий Е.И.

    Исследование возможности ускорения выполнения серии БПФ для микрофонной решетки на GPU // Научные работы участников конкурса "Молодые ученые Университета ИТМО" 2016 года - 2017. - С. 77-83

  • Иванько Д.

    Разработка системы аудиовизуального распознавания русской речи // Альманах научных работ молодых ученых Университета ИТМО - 2017. - Т. 1. - С. 84-87

  • Иванько Д.

    Анализ современных методов аудиовизуального распознавания речи, основанных на глубоком обучении // Научные работы участников конкурса "Молодые ученые Университета ИТМО" 2016 года - 2017. - С. 125-127

  • Копеев К.

    Выделение речевого сигнала на фоне когерентной помехи с использованием микрофонной решетки // Научные работы участников конкурса "Молодые ученые Университета ИТМО" 2016 года - 2017. - С. 248-251

  • Копеев К., Столбов М.Б.

    2-микрофонные решетки для приема широкополосного сигнала и подавления широкополосной помехи // Альманах научных работ молодых ученых Университета ИТМО - 2017. - Т. 3. - С. 105-108

  • Лобашов А.В.

    Управление рисками тестирования. Работа с рисками в тестировании многоканальных систем записи и аналитики. // Альманах научных работ молодых ученых Университета ИТМО - 2017. - Т. ???. - С. в печати

  • Казиева Н., Калиев А.

    Анализ применения вейвлет-преобразования Морле для обработки речевых сигналов // Альманах научных работ молодых ученых Университета ИТМО - 2017. - Т. 3. - С. 87-89

  • Олейник А.Л.

    Преобразование и совместная обработка фотоизображений лиц и скетчей // Альманах научных работ молодых ученых Университета ИТМО - 2017. - Т. 3. - С. 137-140 More

  • Томашенко Н.А.

    Адаптация акустических моделей в системах автоматического распознавания речи // Научные работы участников конкурса "Молодые ученые Университета ИТМО" 2016 года - 2017. - С. 1-6

  • Волковая В.Н.

    Реализация системы распознавания медицинских протоколов на основе глубоких нейронных сетей // Научные работы участников конкурса "Молодые ученые Университета ИТМО" 2016 года - 2017. - С. 61-67

  • Лаврентьева Г.М.

    Современные методы детектирования атак на голосовые биометрические системы с целью взлома // Научные работы участников конкурса "Молодые ученые Университета ИТМО" 2016 года - 2017. - С. в печати

  • Олейник А.Л.

    Метод взаимной трансформации и генерации популяций фотографий лиц и скетчей // Научные работы участников конкурса "Молодые ученые Университета ИТМО" 2016 года - 2017

  • Кухарев Г.А., Матвеев Ю.Н., Олейник А.Л.

    Алгоритмы взаимной трансформации изображений для систем обработки и поиска визуальной информации // Научно-технический вестник информационных технологий, механики и оптики - 2017. - Т. 17. - № 1(107). - С. 62–74 More

  • Алексеев А.А.

    Обучение на трехмерных моделях при асимметричном распознавании // Альманах научных работ молодых ученых Университета ИТМО - 2017. - Т. ???. - С. ???

  • Алексеев А.А.

    Быстрый метод стереосопоставления на основе выделения и анализа контрастных областей // Научные работы участников конкурса "Молодые ученые Университета ИТМО" 2016 года - 2017. - С. 1-3

  • Алексеев А.А.

    Методика кластеризации и распознавания динамических последовательностей с помощью аппарата марковских цепей // Робототехника и техническая кибернетика - 2017. - № 2(15). - С. 37-47 More

  • Aleinik S.

    Acceleration of Zelinski Post-Filtering Calculation // Journal of Signal Processing Systems - 2017, Vol. 88, No. 3, pp. 463-468 More

2016 year
  • Shuranov E., Lavrentyev A., Kozlyaev A., Lavrentyeva G., Volkovaya V.

    Finding Speaker Position Under Difficult Acoustic Conditions // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9811, pp. 321-327 More

  • Лаврентьева Г.М.

    Современные методы детектирования спуфинг атак на голосовые биометрические системы//Сборник тезисов докладов конгресса молодых ученых. Электронное издание - 2016

  • Кабаров В.И., Черных И.А., Левин К.Е., Булушева А.В.

    Разработка метода автоматической расстановки знаков препинания для использования в задачах интеллектуального анализа речи//Сборник тезисов докладов конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО - 2016

  • Булушева А.В., Черных И.А., Кабаров В.И.

    Разработка метода автоматической расстановки знаков препинания для использования в задачах интеллектуального анализа речи // Сборник трудов V Всероссийского конгресса молодых ученых (Санкт-Петербург, 12-15 апреля 2016 г.) - 2016. - Т. 1. - С. 57-63 More

  • Черных И.А., Левин К.Е., Меденников И.П., Кабаров В.И.

    Разработка методов лингвистического и семантического анализа для интеллектуальной обработки текстов, полученных в результате автоматического распознавания звучащей спонтанной русской речи // Альманах научных работ молодых ученых Университета ИТМО - 2016. - Т. 5. - С. 211-214 More

  • Тепляков А.В., Кабаров В.И., Кассу А.М.

    Использование мультимодальной системы VoiceGrid для решения задач по учету фонограмм речи, фотоизображений лиц и биометрической идентификации // Альманах научных работ молодых ученых Университета ИТМО - 2016. - Т. 2. - С. 267-270 More

  • Новоселов С.А., Козлов А.В., Лаврентьева Г.М., Симончик К.К., Щемелинин В.Л.

    Противодействие спуфинг атакам на голосовые биометрические системы // Речевые технологии - 2016. - № 1. - С. 22-33 More

  • Столбов М.Б., Галюк В.Е.

    Разработка алгоритма деклиппирования - методы восстановления клиппированного сигнала // Сборник тезисов докладов конгресса молодых ученых (V Всероссийский конгресс молодых ученых, 12-15 апреля 2016 г.). Электронное издание - 2016

  • Лаврентьева Г.М.

    Методы противодействия спуфинг атакам на голосовые биометрические системы // Альманах научных работ молодых ученых Университета ИТМО - 2016. - Т. 3. - С. 93-95 More

  • Рюмин Д.А., Карпов А.А.

    Автоматизированная система распознавания отдельных жестов рук с применением сенсора Kinect // Информационные технологии в управлении (ИТУ-2016): материалы 9-й конференции по проблемам управления (Санкт-Петербург, 4-6октября 2016г.) - 2016. - С. 838-846

  • Алексеев А.А.

    Методы и алгоритмы получения карт глубины для их использования в ассиметричных видеосистемах // XXI век: итоги прошлого и проблемы настоящего плюс - 2016. - № 6(34). - С. 23-30 More

  • Волковая В.Н., Шуранов Е.В.

    Улучшение разборчивости речевого сигнала на записях с удаленного от диктора микрофона//Сборник тезисов докладов V Всероссийского конгресса молодых ученых. - 2016

  • Волковая В.Н., Козляев А.Л., Шуранов Е.В.

    Определение положения диктора на основе алгоритмов идентификации//Сборник тезисов докладов V Всероссийского конгресса молодых учёных - 2016

  • Prudnikov A., Korenevsky M.L.

    Training maxout neural networks for speech recognition tasks // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9924, pp. 443-451 More

  • Столбов М.Б., Кассу А.М.

    Цифровая обработка речевых сигналов: Учебно-методическое пособие по лабораторному практикуму - 2016

  • Medennikov I., Prudnikov A., Zatvornitskiy A.

    Improving English conversational telephone speech recognition // Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH - 2016, pp. 2-6 More

  • Kudashev O., Novoselov S., Simonchik K., Kozlov A.

    A speaker recognition system for the SITW challenge // Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH - 2016, pp. 833-837 More

  • Столбов М.Б., Алейник С.В., Олейник А.Л.

    Улучшение направленности микрофонных решеток в низкочастотной области // Альманах научных работ молодых ученых Университета ИТМО - 2016. - Т. 1. - С. 23-26 More

  • Карпов А.А., Кайа Х., Салах А.

    Актуальные задачи и достижения систем паралингвистического анализа речи // Научно-технический вестник информационных технологий, механики и оптики - 2016. - Т. 16. - № 4(104). - С. 581–592 More

  • Волковая В.Н., Шуранов Е.В.

    Улучшение разборчивости речевого сигнала на записях с удалённого от диктора микрофона // Сборник трудов V Всероссийского конгресса молодых ученых (Санкт-Петербург, 12-15 апреля 2016 г.) - 2016. - Т. 1. - С. 96-99 More

  • Томашенко Н.А., Хохлов Ю.Ю., Ларшер Э., Эстев Я., Матвеев Ю.Н.

    Использование в системах автоматического распознавания речи GMM-моделей для адаптации акустических моделей, построенных на основе искусственных нейронных сетей // Научно-технический вестник информационных технологий, механики и оптики - 2016. - Т. 16. - № 6(106). - С. 1063-1072 More

  • Кабаров В.И., Алсуфьев А.А.

    Создание речевых баз данных на польском и чешском языках для целей идентификации диктора // Альманах научных работ молодых ученых Университета ИТМО - 2016. - Т. 1. - С. 55-57 More

  • Иванько Д., Карпов А.А.

    Применение высокоскоростной камеры в задачах человеко-машинного взаимодействия // Информационные технологии в управлении (ИТУ-2016): материалы 9-й конференции по проблемам управления (Санкт-Петербург, 4-6октября 2016г.) - 2016. - С. 801-806

  • Kudubayeva S.A., Ryumin D., Sndetbayeva A., Krak Y.

    Computing of hands gestures' informative video features // Computer Sciences and Information Technologies - Proceedings of the 11th International Scientific and Technical Conference, CSIT 2016 - 2016, pp. 55-58 More

  • Рюмин Д.А., Карпов А.А.

    Вычисление информативных видеопризнаков для распознавания жестов рук // Сборник тезисов докладов конгресса молодых ученых (V Всероссийский конгресс молодых ученых, 12-15 апреля 2016 г.). Электронное издание - 2016 More

  • Tomashenko N.

    GMM-derived features for speaker adaptation of deep neural network acoustic models in automatic speech recognition systems//JDOC 2016 Conference, IET - 2016, pp. 1-4

  • Томашенко Н.А.

    Использование GMM-моделей для адаптации акустических моделей, построенных на основе искусственных нейронных сетей, в системах автоматического распознавания речи // Альманах научных работ молодых ученых Университета ИТМО - 2016. - Т. 5. - С. 103-105 More

  • Tomashenko N.A., Vythelingum K., Rousseau A., Esteve .

    Tomashenko N.A., Vythelingum K., Rousseau A., Esteve Y. LIUM ASR systems for the 2016 Multi-Genre Broadcast Arabic Challenge // IEEE Workshop on Spoken Language Technology, SLT 2016 - Proceedings - 2016, pp. 285-291 More

  • Tomashenko N., Khokhlov Y., Esteve .

    Tomashenko N., Khokhlov Y., Esteve Y. On the Use of Gaussian Mixture Model Framework to Improve Speaker Adaptation of Deep Neural Network Acoustic Models // Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH - 2016, pp. 3788-3792 More

  • Tomashenko N.A., Khokhlov Y.Y., Esteve Y.-.

    A new perspective on combining GMM and DNN frameworks for speaker adaptation // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9918, pp. 120-132 More

  • Рыбин С.В., Матвеев Ю.Н., Кабаров В.И.

    Новая образовательная магистерская программа «Системы голосового самообслуживания» // Компьютерные инструменты в образовании - 2016. - № 4. - С. 54-60 More

  • Stolbov M., Aleinik S.

    Microphone array directivity improvement in low-frequency band for speech processing // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9811, pp. 484-490 More

  • Korenevsky M.L., Medennikov I.P., Shchemelinin V.

    Improving the quality of automatic speech recognition in trucks // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9811, pp. 362-369 More

  • Tomashenko N.A., Khokhlov Y., Larcher A.-., Esteve Y.-.

    Exploring GMM-derived features for unsupervised adaptation of deep neural network acoustic models // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9811, pp. 304-311 More

  • Kipyatkova I.S., Karpov A.A.

    Dnn-based acoustic modeling for Russian speech recognition using Kaldi // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9811, pp. 246-253 More

  • Medennikov I., Prudnikov A.

    Advances in STC Russian spontaneous speech recognition system // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9811, pp. 116-123 More

  • Aleinik S.

    Optimization of zelinski post-filtering calculation // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9811, pp. 523-530 More

  • Medennikov I., Bulusheva A.

    LSTM-based language models for spontaneous speech recognition // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9811, pp. 469-475 More

  • Stolbov M.B., Lavrentyev A.

    Speech enhancement with microphone array using a multi beam adaptive noise suppressor // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9811, pp. 636-644 More

  • Shulipa A., Novoselov S., Melnikov A.

    Approaches for out-of-domain adaptation to improve speaker recognition performance // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9811, pp. 124-130 More

  • Bulgakova E., Sholokhov A.

    Semi-automatic speaker verification system based on analysis of formant, durational and pitch characteristics // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9811, pp. 613-619 More

  • Simonchik K.K., Novoselov S., Lavrentyeva G.

    Comparative analysis of classifiers for automatic language recognition in spontaneous speech // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9811, pp. 174-181 More

  • Debiao H., Kumar N., Huaqun W., Lina W., Choo K., Vinel A.V.

    A Provably-Secure Cross-Domain Handshake Scheme with Symptoms-Matching for Mobile Healthcare Social Network // IEEE Transactions on Dependable and Secure Computing - 2016, No. 1, pp. in press More

  • Smirnov A.B., Mendelev V.S.

    Knowledge Transfer for Utterance Classification in Low-Resource Languages // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9811, pp. 435-442 More

  • Убский Д.С.

    Сверточная нейронная сеть для распознавания речи // Альманах научных работ молодых ученых Университета ИТМО - 2016. - Т. 5. - С. 127-128 More

  • Убский Д.С.

    Сегментация длинных аудиозаписей//Сборник тезисов докладов V Всероссийского конгресса молодых ученых - 2016

  • Баландин М.А.

    Обзор алгоритмов поиска характеристических точек лица в режиме реального времени//Сборник тезисов докладов V Всероссийского конгресса молодых ученых - 2016

  • Галюк В.Е., Столбов М.Б.

    Разработка алгоритма деклиппирования - детектирование клиппированных участков сигнала // Альманах научных работ молодых ученых Университета ИТМО - 2016. - Т. 1. - С. 280-282 More

  • Галюк В.Е.

    Разработка алгоритма деклиппирования - методы восстановления клиппированного сигнала//Сборник тезисов докладов V Всероссийского конгресса молодых ученых - 2016

  • Пугачев А.А.

    Создание кластера для вычисления на графических процессорах // Альманах научных работ молодых ученых Университета ИТМО - 2016. - Т. 4. - С. 197-198 More

  • Пугачев А.А.

    Создание системы распределённых вычислений работающей совместно с GPU//Сборник тезисов докладов V Всероссийского конгресса молодых ученых - 2016

  • Верхоляк О.В.

    Автоматическое распознавание эмоционального состояния диктора по речевому сигналу // Альманах научных работ молодых ученых Университета ИТМО - 2016. - Т. 1. - С. 237-240 More

  • Verkhodanova V.O., Ronzhin A., Kipyatkova I.S., Ivanko D.V., Karpov A.A., Zhelezny M.

    HAVRUS Corpus: High-Speed Recordings of Audio-Visual Russian Speech // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9811, pp. 338-345 More

  • Верхоляк О.В., Мун С.

    Использование NMF алгоритма для идентификации диктора//Сборник тезисов докладов V Всероссийского конгресса молодых ученых - 2016

  • Фельдина Е.А.

    Администрирование и тестирование текстовой диалоговой системы // Альманах научных работ молодых ученых Университета ИТМО - 2016. - Т. 5. - С. 147-148 More

  • Фельдина Е.А.

    Архитектура текстовой диалоговой системы//Сборник тезисов докладов V Всероссийского конгресса молодых ученых - 2016

  • Лобашов А.В., Труфанов А.А.

    Актуальность дисциплины "Основы деятельности инновационного предприятия" // Альманах научных работ молодых ученых Университета ИТМО - 2016. - Т. 3. - С. 137-139 More

  • Лобашов А.В.

    Повышение качества продуктов многоканальных систем записи и оповещения // Альманах научных работ молодых ученых Университета ИТМО - 2016. - Т. 3. - С. 136 More

  • Лобашов А.В.

    Особенности обучения по практико-ориентированной магистерской программе "системы голосового самообслуживания" // Альманах научных работ молодых ученых Университета ИТМО - 2016. - Т. 3. - С. 134-135 More

  • Suyundukova E., Rybin S. Research and development of the individual elements of prosodic design synthesized speech in Russian and Arabic // Almanac of scientific works of young scientists of the University ITMO - 2016. - Vol. 5. - pp 61-64 More

  • Zakharov D, Rybin S. Use statistical WFST-models for the synthesis of Arabic speech // Almanac of scientific works of young scientists of the University ITMO - 2016. - Vol. 2. - pp. 164-166 More

  • Shulipa A., Novoselov S., Matveev Y.

    Scores Calibration in Speaker Recognition Systems // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9811, pp. 596-603 More

  • Medennikov I.P. Two-step algorithm of training initialization for acoustic models based on deep neural networks. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2016, vol. 16, no. 2, pp. 379–381. More

  • Tomashenko N., Khokhlov Y.-., Larcher A.-., Esteve Y.-.

    Exploration de parametres acoustiques derives de GMMs pour l’adaptation non supervisee de modeles acoustiques a base de reseaux de neurones profonds // Actes de la conference conjointe JEP-TALN-RECITAL 2016, JEP - 2016, Vol. 1, pp. 337-345 More

  • Kukharev G., Matveev Y.N., Forczmanski P.

    An approach to improve accuracy of photo–to–sketch matching // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9730, pp. 385-393 More

  • Ryumin D., Kudubayeva S.A., Kalghanov M.

    The influence of the Kazakh language semantic peculiarities on computer sign language // IADIS International Journal on Computer Science & Information Systems - 2016, Vol. 2, No. 11, pp. 221-226 More

  • Kaya H., Karpov A.A., Ali Salah A.

    Robust Acoustic Emotion Recognition based on Cascaded Normalization and Extreme Learning Machines // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9719, pp. 115-123 More

  • Kipyatkova I., Karpov A.

    Language Models with RNNs for Rescoring Hypotheses of Russian ASR // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9719, pp. 418-425 More

  • Kudashev O., Novoselov S., Pekhovsky T., Simonchik K., Lavrentyeva G.

    Usage of DNN in speaker recognition: advantages and problems // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9719, pp. 82-91 More

  • Gruber I., Hlavac M., Hruz M., Zelezny M., Karpov A.A.

    An Analysis of Visual Faces Datasets // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9812, pp. 18-26 More

  • Романенко А.Н.

    РАСПОЗНАВАНИЕ СПОНТАННОЙ АРАБСКОЙ РЕЧИ В ТЕЛЕФОННОМ КАНАЛЕ//Сборник тезисов докладов конгресса молодых ученых. Электронное издание. - http://openbooks.ifmo.ru/ru/file/4056/4056.pdf - 2016

  • Romanenko A.N. Development of automated speech recognition system for Egyptian Arabic phone conversations. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2016, vol. 16, no. 4, pp. 703–709. More

  • Korenevsky M., Romanenko A. Feature space VTS with phase term modeling // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9811, pp. 312-320 More

  • Romanenko A., Mendelev V. Speaker-dependent bottleneck features for Egyptian Arabic speech recognition // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9811, pp. 620-626 More

  • Oleinik A.L. Application of binary descriptors to multiple face tracking in video surveillance systems. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2016, vol. 16, no. 4, pp. 670–677. More

  • Ivanko D.V., Kipyatkova I.S., Ronzhin A.L., Karpov A.A. Analysis of multimodal fusion techniques for audio-visual speech recognition. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2016, vol. 16, no. 3, pp. 387–401. More

  • Kukharev G., Oleinik A. Face Photo-Sketch Transformation and Population Generation // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9972, pp. 329-340 More

  • Oleinik A. A Lightweight Face Tracking System for Video Surveillance // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2016, Vol. 9730, pp. 407-414 More

  • Лобашов А.В.

    Временная оценка при планировании тестирования. Сопоставление запланированного и затраченного времени//Сборник тезисов докладов V Всероссийского конгресса молодых ученых - 2016

  • Bulgakova E.V., Sholokhov A.V. Semi-automatic speaker verification system. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2016, vol. 16, no. 2, pp. 284–289. More

  • Sholokhov A., Kinnunen T., Сumani S. Discriminative multi-domain PLDA for speaker verification // ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings - 2016, pp. 5030-5034 More

  • Novoselov S., Kozlov A., Lavrentyeva G., Simonchik K., Shchemelinin V.

    STC anti-spoofing systems for the ASVspoof 2015 challenge // ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings - 2016, pp. 5475-5479 More

  • Kukharev G., Matveev Y.N., Shchegoleva N.

    New solutions for face photo retrieval based on sketches // Pattern Recognition and Image Analysis - 2016, Vol. 26, No. 1, pp. 165-175 More

  • D. V. Ivanko, A. A. Karpov, “An Analysis of Perspectives for Using High-Speed Cameras in Processing Dynamic Video Information”, Tr. SPIIRAN, 44 (2016), 98–113 More

  • Dmitry V. Ivanko. Modeling of face recognition systems using mnemonic description of the model. More

2015 year
  • Лукьянец Е.А.

    Возможные способы обхода защиты лицевых биометрических систем с помощью фотографии и защита от них//Сборник тезисов докладов IV Всероссийского конгресса молодых ученых. Электронное издание. – СПб: Университет ИТМО, http://openbooks.ifmo.ru/ru/file/852/852.pdf - 2015

  • Кабаров В.И., Матвеев Ю.Н.

    Вопросы методики формирования речевых баз данных для целей идентификации и верификации диктора//Сборник тезисов докладов конгресса молодых ученых. Электронное издание . – СПб: Университет ИТМО - 2015

  • Kipyatkova I.S., Karpov A.A.

    Recurrent neural network-based language modeling for an automatic Russian speech recognition system // Proceedings of Artificial Intelligence and Natural Language and Information Extraction, Social Media and Web Search FRUCT Conference, AINL-ISMW FRUCT 2015 - 2015, pp. 33-38 More

  • Алейник С.В.

    Ускорение алгоритма фильтрации Зелинского // Альманах научных работ молодых ученых Университета ИТМО - 2015. - Т. 1. - С. 10-14 More

  • Иванько Д.

    Улучшение качества изображений лиц, на основе метода анализа главных компонент // Альманах научных работ молодых ученых Университета ИТМО - 2015. - Т. 1. - С. 213-215 More

  • Пеховский Т.С., Шолохов А.В.

    Смесь гауссовых PLDA-анализаторов для систем верификации дикторов // Альманах научных работ молодых ученых Университета ИТМО - 2015. - Т. 3. - С. 235-239 More

  • Тепляков А.В.

    Реверберация в закрытых помещениях и обзор существующих программных способов компенсации реверберационных искажений речевого сигнала // Альманах научных работ молодых ученых Университета ИТМО - 2015. - Т. 3. - С. 150-152 More

  • Щемелинин В.Л.

    Оценка эффективности биометрических систем // Альманах научных работ молодых ученых Университета ИТМО - 2015. - Т. 3. - С. 244-248 More

  • Булгакова Е.В.

    Оценка надежности автоматических и экспертных методов в рамках решения задачи идентификации диктора по голосу и речи // Альманах научных работ молодых ученых Университета ИТМО - 2015. - Т. 1. - С. 86-89 More

  • Корявцев В.П., Бибиков С.В.

    Организация процессов в операционной системе реального времени устройства «Сигнализатор-П» // Альманах научных работ молодых ученых Университета ИТМО - 2015. - Т. 2. - С. 60-62 More

  • Столбов М.Б., Алейник С.В.

    Оптимизация геометрии планарных микрофонных решеток // Альманах научных работ молодых ученых Университета ИТМО - 2015. - Т. 3. - С. 134-137 More

  • Прудников А.А.

    Обучение нейросетевых акустических моделей для распознавания спонтанной речи // Альманах научных работ молодых ученых Университета ИТМО - 2015. - Т. 3. - С. 40-43 More

  • Крутов Д.Ю.

    Методы автоматической коррекции ошибок распознавания речи в системах голосового обслуживания // Альманах научных работ молодых ученых Университета ИТМО - 2015. - Т. 2. - С. 66-68 More

  • Болотнов Ф.В., Бибиков С.В.

    Исследование полосно-энергетического алгоритма обнаружения виброакустических колебаний приближающегося поезда // Альманах научных работ молодых ученых Университета ИТМО - 2015. - Т. 1. - С. 65-66 More

  • Олейник А.Л.

    Задачи лицевой и голосовой биометрии: сценарии, технологии, методы // Альманах научных работ молодых ученых Университета ИТМО - 2015. - Т. 2. - С. 211-214 More

  • Филитович И.С.

    Детекция выбросов в данных большой размерности на основе Гауссовой смеси // Альманах научных работ молодых ученых Университета ИТМО - 2015. - Т. 3. - С. 197-200 More

  • Кабаров В.И.

    Вопросы проектирования речевых баз данных // Альманах научных работ молодых ученых Университета ИТМО - 2015. - Т. 2. - С. 6-8 More

  • Пятышев Е.И.

    Анализ применения инструментария Kaldi для распознавания речи // Альманах научных работ молодых ученых Университета ИТМО - 2015. - Т. 3. - С. 48-50 More

  • Рыбин С.В.

    Математические методы цифровой обработки сигналов - 2015

  • Tampel I. B. AUTOMATIC SPEECH RECOGNITION – THE MAIN STAGES OVER LAST 50 YEARS. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2015 , no. 6 , pp. 957-968 (in Russian). More

  • Томашенко Н.А.

    Адаптация к диктору акустических моделей, построенных на основе глубоких нейронных сетей, в системах автоматического распознавания речи // Альманах научных работ молодых ученых Университета ИТМО - 2015. - Т. 3. - С. 169-171 More

  • Novoselov S., Pekhovsky T., Shulipa A., Kudashev O.

    PLDA-based System for Text-prompted Password Speaker Verification // AVSS 2015 - 12th IEEE International Conference on Advanced Video and Signal Based Surveillance - 2015, pp. 7301798 More

  • Rybin S. Methods for assessing the quality of the classification algorithms // Almanac of scientific works of young scientists of the University ITMO - 2015. - Vol. 3. - pp. 59-61 More

  • Prudnikov A., Korenevsky M., Aleinik S.

    Adaptive Beamforming and Adaptive Training of DNN Acoustic Models for Enhanced Multichannel Noisy Speech Recognition // IEEE Workshop on Automatic Speech Recognition and Understanding, ASRU 2015 - Proceedings - 2015, pp. 401-408 More

  • Kukharev G., Matveev Y.N., Shchegoleva N.

    Matching of a sketches with an original photos // Proceedings of the 18th International Conference on Soft Computing and Measurements, SCM 2015 (St.Petersburg, May 19-21) - 2015, pp. 157-159 More

  • Rybin S. Teaching Discrete Mathematics engineering students // Computer Tools in Education - 2015. - N3. - pp. 39-44. More

  • Kaya H., Karpov A., Ali Salah A.

    Fisher Vectors with Cascaded Normalization for Paralinguistic Analysis // Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH - 2015, pp. 909-913 More

  • Tomashenko N., Khokhlov Y.

    GMM-derived features for effective unsupervised adaptation of deep neural network acoustic models // Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH - 2015, pp. 2882-2886 More

  • Korenevsky M.L., Smirnov A.B., Mendelev V.S.

    Prediction of Speech Recognition Accuracy for Utterance Classification // Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH - 2015, pp. 1275-1279

  • Shchemelinin V., Kozlov A., Lavrentyeva G., Novoselov S., Simonchik K.

    Vulnerability of Voice Verification System with STC Anti-spoofing Detector to Different Methods of Spoofing Attacks // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2015, Vol. 9319, pp. 480-486 More

  • Bulgakova E., Sholohov A., Tomashenko N., Matveev Y.

    Speaker Verification Using Spectral and Durational Segmental Characteristics // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2015, Vol. 9319, pp. 397-404 More

  • Aleinik S.V., Stolbov M.B.

    SNR Estimation based on Adaptive Signal Decomposition for Quality Evaluation of Speech Enhancement Algorithms // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2015, Vol. 9319, pp. 364-371 More

  • Khomitsevich O.G., Chistikov P.G., Krivosheeva T.E., Epimakhova N., Chernykh I.

    Combining Prosodic And Lexical Classifiers For Two-Pass Punctuation Detection In A Russian ASR System // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2015, Vol. 9319, pp. 161-169 More

  • Lyakso E., Frolova O., Dmitrieva E., Grigorev A., Kaya H., Ali Salah A., Karpov A.

    EmoChildRu: Emotional Child Russian Speech Corpus // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2015, Vol. 9319, pp. 144-152 More

  • Kipyatkova I., Karpov A.

    A Comparison of RNN LM and FLM for Russian Speech Recognition // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2015, Vol. 9319, pp. 42-50 More

  • Aleinik S., Stolbov M.

    A Comparative Study of Speech Processing in Microphone Arrays with Multichannel Alignment and Zelinski Post-Filtering // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2015, Vol. 9319, pp. 34-41 More

  • Melnikov A., Akhunzyanov R., Kudashev O., Luckyanets E.

    Audiovisual Liveness Detection // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2015, Vol. 9280, pp. 643-652 More

  • Khomitsevich O.G., Mendelev V.S., Tomashenko N.A., Rybin S.V., Medennikov I.P., Kudubayeva S.A.

    A Bilingual Kazakh-Russian System for Automatic Speech Recognition and Synthesis // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2015, Vol. 9319, pp. 25-33 More

  • Lavrentyeva G., Kozlov A., Novoselov S., Simonchik K., Shchemelinin V.

    Automatically Trained TTS for Effective Attacks to Anti-spoofing System // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2015, Vol. 9319, pp. 137-143 More

  • Mendelev V.S., Prisyach T.N., Prudnikov A.A.

    Robust Voice Activity Detection With Deep Maxout Neural Networks // Modern Applied Science - 2015, Vol. 9, No. 8, pp. 153-159 More

  • Prudnikov A., Medennikov I., Mendelev V., Korenevsky M., Khokhlov Y.

    Improving Acoustic Models For Russian Spontaneous Speech Recognition // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2015, Vol. 9319, pp. 234-242 More

  • Novoselov S., Pekhovsky T., Kudashev O., Mendelev V., Prudnikov A.

    Non-linear PLDA for i-Vector Speaker Verification // Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH - 2015, pp. 214–218 More

  • Ronzhin A.L., Karpov A.A.

    A Software System for the Audiovisual Monitoring of an Intelligent Meeting Room in Support of Scientific and Education Activities // Pattern Recognition and Image Analysis - 2015, Vol. 25, No. 2, pp. 237–254 More

  • Karpov A.A., Ronzhin A.L., Kipyatkova I.

    Automatic Analysis of Speech and Acoustic Events for Ambient Assisted Living // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2015, Vol. 9176, pp. 455-463 More

  • Kipyatkova I., Karpov A.A.

    Development of Factored Language Models for Automatic Russian Speech Recognition // Komp'juternaja Lingvistika i Intellektual'nye Tehnologii - 2015, Vol. 1, No. 14, pp. 241-254 More

  • Simonchik K., Aleinik S., Ivanko D., Lavrentyeva G.

    Automatic Preprocessing Technique for Detection of Corrupted Speech Signal Fragments for the Purpose of Speaker Recognition // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2015, Vol. 9319, pp. 121-128 More

  • Stolbov M.B., Aleinik S.V.

    Improvement of Microphone Array Characteristics for Speech Capturing // Modern Applied Science - 2015, Vol. 9, No. 6, pp. 343-352 More

  • Karpov A., Verkhodanova V. Speech technologies for under-resourced languages of the world // Voprosy Jazykoznanija (Topics in the study of language) - 2015. - № 2. - P. 117-135 More

  • Karpov A. 4 th International workshop on spoken language technologies for under-resourced languages // Voprosy Jazykoznanija (Topics in the study of language) - 2015. - № 2. - P. 150-152 More

  • E. V. Bulgakova, A. V. Sholokhov, N. A. Tomashenko SPEAKERS' IDENTIFICATION METHOD BASED ON COMPARISON OF PHONEME LENGTHS STATISTICS. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2015, no. 1 , pp. 70-77 (in Russian). More

  • Dyrmovsky D., Matveev Yu., Balykina L. The modern speech technology market // Control Engineering Russia - 2015. - No. 1(55). - P. 18-24 More

  • Sukhmel V., Aleinik S.V., Shchemelinin V.L.

    Voice Passphrase Variability Evaluation for Speaker Recognition // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2015, Vol. 8915, pp. 3-9 More

  • Matveev Y.N., Kukharev G.A., Shchegoleva N.L.

    A Simple Method for Generating of Facial Barcodes // 22nd International Conference in Central Europe on Computer Graphics, Visualization and Computer Vision, WSCG 2014 - 2015, pp. 213-221 More

2014 year
  • Novoselov S., Pekhovsky T.S., Shulipa A.K., Sholokhov A.V.

    Text-dependent GMM-JFA system for password based speaker verification // ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings - 2014, pp. 729-733 More

  • Kipyatkova I.S., Verkhodanova V.O., Karpov A.

    Rescoring N-Best Lists for Russian Speech Recognition using Factored Language Models // 4th Workshop on Spoken Language Technologies for Under-resourced languages, SLTU 2014 - 2014, pp. 81-86 More

  • Karpov A. An automatic multimodal speech recognition system with audio and video information. Automation and Remote Control, 2014, Vol. 75, No. 12, pp. 2190–2200. More

  • Karpov A. A., Zelezny M. BILINGUAL MULTIMODAL SYSTEM FOR TEXT-TO-AUDIOVISUAL SPEECH AND SIGN LANGUAGE SYNTHESIS. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2014 , no. 5 , pp. 92-98 (in Russian). More

  • Karpov A.A., Akarun L., Yalcin H., Ronzhin A., Demiroz B., Coban A., Zelezny M.

    Audio-Visual Signal Processing in a Multimodal Assisted Living Environment // Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH - 2014, pp. 1023-1027 More

  • Novoselov S.A., Pekhovsky T.S., Simonchik K.K., Shulipa A.K.

    RBM-PLDA subsystem for the NIST i-Vector Challenge // Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH - 2014, pp. 378-382 More

  • Pozdnyakov, S., Rybin S., Chukhnov A. Information and communication technologies in the course of discrete mathematics // Educational Technology and Society - 2014. - Vol. 17. - N4. - pp. 576-592

  • Rybin S. Speech synthesis // ITMO University - 2014

  • Суюндукова Е.А.

    17 международная конференция студентов-филологов СПбГУ//сборник тезисов 17 международной конференции студентов-филологов СПбГУ - 2014. - С. 67

  • Kukharev G. A., Matveev Y. N., Shchegoleva N. L. PEOPLE RETRIEVAL BY MEANS OF COMPOSITE PICTURES: PROBLEM STATE-OF-THE-ART AND TECHNOLOGIES. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2014 , no. 6 , pp. 123-136 (in Russian). More

  • Batura V. A., Tropchenko A. J. COMPARATIVE ANALYSIS OF APPLICATION EFFICIENCY OF ORTHOGONAL TRANSFORMATIONS IN FREQUENCY ALGORITHMS FOR DIGITAL IMAGE WATERMARKING. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2014 , no. 6 , pp. 106-112 (in Russian). More

  • Karpov A.

    An Automatic Multimodal Speech Recognition System with Audio and Video Information // Automation and Remote Control - 2014, Vol. 75, No. 12, pp. 2190-2200 More

  • Kipyatkova I., Karpov A.

    Study of Morphological Factors of Factored Language Models for Russian ASR // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2014, Vol. 8773, No. LNAI, pp. 451-458 More

  • Karpov A., Kipyatkova I., Zelezny M.

    A Framework for Recording Audio-Visual Speech Corpora with a Microphone and a High-Speed Camera // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2014, Vol. 8773, No. LNAI, pp. 50-57 More

  • Tomashenko N., Khokhlov Y.

    Speaker adaptation of context dependent deep neural networks based on MAP-adaptation and GMM-derived feature processing // Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH - 2014, pp. 2997-3001 More

  • Levin K., Ponomareva I., Bulusheva A., Chernykh G., Medennikov I., Merkin N., Prudnikov A., Tomashenko N.

    Automated closed captioning for Russian live broadcasting // Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH - 2014, pp. 1438-1442 More

  • Chernykh G., Korenevsky M., Levin K., Ponomareva I., Tomashenko N.

    State Level Control for Acoustic Model Training // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2014, Vol. 8773, No. LNAI, pp. 435–442 More

  • Tomashenko N., Khokhlov Y.

    Speaking Rate Estimation Based on Deep Neural Networks // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2014, Vol. 8773, No. LNAI, pp. 418–424 More

  • Khomitsevich O., Chistikov P., Zakharov D.

    Using Random Forests for Prosodic Break Prediction Based on Automatic Speech Labeling // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2014, Vol. 8773, No. LNAI, pp. 467–474 More

  • Chistikov P., Zakharov D., Talanov A.

    Improving Speech Synthesis Quality For Voices Created From an Audiobook Database // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2014, Vol. 8773, No. LNAI, pp. 276–283 More

  • Chistikov P., Talanov A.

    High Quality Speech Synthesis Using a Small Speech Dataset // 4th Workshop on Spoken Language Technologies for Under-resourced languages, SLTU 2014 - 2014, pp. 105–111 More

  • Chistikov P., Khomitsevich O.G., Rybin S.V. STATISTICAL METHODS FOR AUTOMATIC PROSODIC BREAK DETECTION IN A TEXT-TO-SPEECH SYSTEM // Scientific and Technical Journal «Priborostroenie». - 2014. - Vol. 57. - № 2. - P. 28-32 More

  • Novoselov S.A., Sukhmel V.A., Sholokhov A., Pekhovsky T. EMPLOYMENT OF DTW-BASED HMM-GMM MULTI-SESSION TRAINING IN TEXTDEPENDENT SPEAKER VERIFICATION // Scientific and Technical Journal «Priborostroenie». - 2014. - Vol. 57. - № 2. - P. 77-84 More

  • Matveev Yu., Shulipa A. ANALYSIS OF MANIFOLD LEARNING METHODS APPLICABILITY TO SPEAKER RECOGNITION // Scientific and Technical Journal «Priborostroenie». - 2014. - Vol. 57. - № 2. - P. 70-76 More

  • Beziakina D., Bulgakova E.

    A Cross-Gender Statistical Analysis of Tuvinian Intonation Features in Comparison With Uzbek and Azerbaijani // International Journal of Computer, Information Science and Engineering - 2014, Vol. 8, No. 5, pp. 683-685 More

  • Bibikov S.V., Matveev Yu., Semenov N.N. ASSESSMENT OF FUNCTIONAL SAFETY OF DETECTION OF VIBROACOUSTIC SIGNAL FROM ARRIVING TRAIN WITH ENERGY SENSOR // Scientific and Technical Journal «Priborostroenie». - 2014. - Vol. 57. - № 2. - P. 47-52 More

  • Khitrov M. V. , Vasiliev A. Yu. ANALYSIS OF LANGUAGE STATISTICAL ASPECTS AND THEIR GENDER VARIATIONS BY THE EXAMPLE OF LITHUANIAN // Scientific and Technical Journal «Priborostroenie». - 2014. - Vol. 57. - № 2. - P. 7-11 (in Russian) More

  • Stolbov M., Tatarnikova M.Yu. TARGET AND NON-TARGET SPEECH SEPARATION USING A DUAL MICROPHONE SYSTEM // Scientific and Technical Journal «Priborostroenie». - 2014. - Vol. 57. - № 2. - P. 53-57 (in Russian) More

  • Dyrmovsky D. V. , Koval S. L. , Khitrov M. V. CONCEPT OF THE NATIONAL VOICE ACCOUNTING AND VOICE BIOMETRIC SEARCH SYSTEM // Scientific and Technical Journal «Priborostroenie». - 2014. - Vol. 57. - № 2. - P. 63-70 (in Russian) More

  • Aleinik S.V., Stolbov M. TIME DELAY ESTIMATION OF AUDIO SIGNALS USING THEIR ENVELOPES // Scientific and Technical Journal «Priborostroenie». -2014. - Vol. 57. - № 2. - P. 33-39 More

  • Kukharev G.A., Matveev Yu.N., Shchegoleva N.L. СREATING OF BARCODES FOR FACIAL IMAGES BASED ON INTENSITY GRADIENTS // Scientific and Technical Journal of Information Technologies, Mechanics and Optics. - 2014. - № 3(91). - P. 88-95 More

  • Sholokhov A.V., Pekhovsky T., Kudashev O., Shulipa A., Kinnunen T.

    Bayesian Analysis of Similarity Matrices for Speaker Diarization // ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings - 2014, pp. 106-109 More

  • Aleinik S.V., Matveev Yu., Sholokhov A. DETECTION OF CLIPPED FRAGMENTS IN ACOUSTIC SIGNALS // Scientific and Technical Journal of Information Technologies, Mechanics and Optics. - 2014. - № 4(92). - P. 91-97 More

  • Kukharev G.A., Matveev Yu.N., Shchegoleva N.L. EXPRESS METHOD OF BARCODE GENERATION FROM FACIAL IMAGES // Scientific and Technical Journal of Information Technologies, Mechanics and Optics. -2014. - № 3(91). - P. 99-106 More

  • Kiselyov V. V. , Tkachenia A. V. , Khitrov M. V. DETERMINATION OF CHANNEL-INDEPENDENT INFORMATION INDICATORS // Scientific and Technical Journal «Priborostroenie». - 2014. - Vol. 57. - № 2. - P. 12-17 (in Russian) More

  • Bulgakova E. V., Krasnova E. EXPERT SYSTEMS AND METHODS FOR SPEAKER IDENTIFICATION // Scientific and Technical Journal «Priborostroenie». - 2014. - Vol. 57. - № 2. - P. 58-63 (in Russian) More

  • Aleinik S.V., Stolbov M. SPEECH SIGNALS STOCHASTICITY AND ITS EVALUATION // Scientific and Technical Journal «Priborostroenie». - 2014. - Vol. 57. - № 2. - P. 40-47 More

  • Kukharev G., Matveev Y., Shchegoleva N.

    A Gradient Method for Generating Facial Barcodes // Communications in Computer and Information Science - 2014, Vol. 436, pp. 121-127 More

  • Kukharev G.A., Matveev Y.N., Shchegoleva N. Barcode generation for face images // Business Informatics - 2014, No. 3(29), P. 28-38 More

  • Aleinik S., Stolbov M.

    Time Delay Estimation Using Signal Envelopes for Synchronisation of Recordings//Proc. of International Conference on Digital Signal Processing (ICDSP-2014), IET - 2014, pp. 66-73

  • Zatvornitskiy A., Romanenko A.N., Korenevsky M.

    Proportional-Integral-Derivative Control of Automatic Speech Recognition Speed // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2014, Vol. 8773, No. LNAI, pp. 360–367 More

  • Shchemelinin V., Topchina M., Simonchik K.

    Vulnerability of Voice Verification Systems to Spoofing Attacks with TTS Voices Based on Automatically Labeled Telephone Speech // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2014, Vol. 8773, No. LNAI, pp. 475–481 More

  • Romanenko A.N., Zatvornitsky A., Medennikov I.P.

    Simplified Simultaneous Perturbation Stochastic Approximation for the optimization of free decoding parameters // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2014, Vol. 8773, No. LNAI, pp. 402-409 More

  • Merkin N., Medennikov I.P., Romanenko A.N., Zatvornitskiy A.

    Controlling the uncertainty area in the real time LVCSR application // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2014, Vol. 8773, No. LNAI, pp. 153–160 More

  • Krasnova E., Bulgakova E.

    The use of speech technology in computer assisted language learning systems // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2014, Vol. 8773, No. LNAI, pp. 459-466 More

  • Краснова Е.В., Bulgakova E., Shchemelinin V., Goloshchapova T.

    Performance Evaluation of Acoustic-Spectrographic Voice Identification Method in Native and Non-native Speech // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2014, Vol. ???, No. ?, pp. ?

  • Aleinik S., Kudashev O.

    Estimating Stochasticity of Acoustic Signals // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2014, Vol. 8773, No. LNAI, pp. 192-199 More

  • Novoselov S., Pekhovsky T., Simonchik K.

    STC speaker recognition system for the NIST i-vector challenge // ODYSSEY 2014, Speaker and Language Recognition Workshop - 2014, pp. 231-240 More

  • Shchemelinin V.L., Simonchik K. STUDY OF VOICE VERIFICATION SYSTEM TOLERANCE TO SPOOFING ATTACKS USING A TEXT-TO-SPEECH SYSTEM // Scientific and Technical Journal «Priborostroenie». - 2014. - Vol. 57. - № 2. - P. 84-88 More

  • Chernykh G. A. , Korenevsky M. L. , Levin K., Ponomareva I. A. , Tomashenko N. A. CROSS-VALIDATION STATE CONTROL IN ACOUSTIC MODEL TRAINING OF AUTOMATIC SPEECH RECOGNITION SYSTEM // Izvestiya Vysshikh Uchebnykh Zavedeniy. Priborostroenie. 2014. Vol. 57, N 2. P. 23—28 (in Russian). More

  • Tomashenko N. A. , Khohlov Yu. Yu. ANALYSIS OF DATA BALANCING PROBLEM IN ACOUSTIC MODELING OF AUTOMATIC SPEECH RECOGNITION SYSTEM // Izvestiya Vysshikh Uchebnykh Zavedeniy. Priborostroenie. 2014. Vol. 57, N 2. P. 17—22 (in Russian). More

  • Karpov A.

    Audiovisual monitoring system of intelligent room for automated support of scientific and educational meetings // Pattern Recognition and Image Analysis - 2014, Vol. 24, No. ?, pp. 1-10

  • Pekhovsky T., Sizov A.

    Comparison between supervised and unsupervised learning of probabilistic linear discriminant analysis mixture models for speaker verification // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2014, Vol. 8621, No. LNCS, pp. XI

  • Stolbov M., Aleinik S.

    Speech enhancement with microphone array using frequency-domain alignment technique // 54th Conference on Audio Forensics Techniques, Technologies, and Practice - 2014, pp. 1-5 More

  • Sholokhov A.V., Kinnunen T., Шулипа А.К., Kudashev O., Pekhovsky T.

    Bayesian Analysis of Similarity Matrices for Speaker Diarization//IEEE International Conference on Audio, Speech, and Signal Processing (ICASSP), IET - 2014, pp. 106-109

  • Simonchik K., Shchemelinin V.

    "STC Spoofing" database for text-dependent speaker recognition evaluation // 4th Workshop on Spoken Language Technologies for Under-resourced languages, SLTU 2014 - 2014, pp. 221-224 More

  • Karpov A., Ronzhin A.

    A Universal Assistive Technology with Multimodal Input and Multimedia Output Interfaces // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2014, Vol. 8513, pp. 369-378 More

  • Aleinik S., Stolbov M.

    Time Delay Estimation Using Signal Envelopes for Synchronisation of Recordings // International Journal of Electrical, Electronic Science and Engineering - 2014, Vol. 8, No. 2, pp. 66-73 More

  • Aleinik S., Matveev Y.

    Detection of Clipped Fragments in Speech Signals // International Journal of Electrical, Electronic Science and Engineering - 2014, Vol. 8, No. 2, pp. 74-80 More

2013 year
  • Матвеев Ю.Н., Симончик К.К., Тропченко А.Ю., Хитров М.В.

    Цифровая обработка сигналов - 2013

  • Pekhovsky T.S., Sizov A.

    Comparison between supervised and unsupervised learning of probabilistic linear discriminant analysis mixture models for speaker verification // Pattern Recognition Letters - 2013, Vol. 34, No. 11, pp. 1307–1313 More

  • Filitovich I.S.

    Moduli Spaces of Planar Pentagonal Linkages: Combinatorial Description Gorodetskaya Irina // http://arxiv.org/ - 2013, pp. http://arxiv.org/pdf/1305.6756v2.pdf

  • Kydashev O. AGGLOMERATIVE CLUSTERING OF SOUND RECORD SPEECH SEGMENTS BASED ON BAYESIAN INFORMATION CRITERION // Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2013, no. 1, pp. 90-93 (in Russian). More

  • Tkachenia A. V. , Davydov A. G., Kiselyov V. V., Khitrov M. V. GINI CRITERION SVM FOR EMOTION CLASSIFICATION FRAMEWORK // Izvestiya Vysshikh Uchebnykh Zavedeniy. Priborostroenie. 2013. Vol. 56, N 2. P. 61-66 (in Russian) More

  • Pekhovsky T.S., Sizov A. Y. EVALUATION OF THE CONFIDENCE INTERVAL FOR DECISION PREDICTION OF AN ENSEMBLE OF CLASSIFIERS // Izvestiya Vysshikh Uchebnykh Zavedeniy. Priborostroenie. 2013. Vol. 56, N 2. P. 51-61 (in Russian) More

  • Tampel I. B., Krasnova E., Panova E., Levin K., Petrova O. APPLICATION OF INFORMATION AND COMMUNICATION TECHNOLOGIES IN COMPUTER AIDED LANGUAGE LEARNING. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2013 , no. 2 , pp. 154-160 (in Russian).

  • Chistikov P., Korolkov E. A., Talanov A. O., Solomennik A. I. A HYBRID TECHNOLOGY FOR TTS SYSTEM BASED ON HIDDEN MARKOV MODELS AND UNIT SELECTION ALGORITHM // Izvestiya Vysshikh Uchebnykh Zavedeniy. Priborostroenie. 2013. Vol. 56, N 2. P. 33-38 (in Russian) More

  • Aleinik S.V., Stolbov M.B. SUPPRESSION OF ACOUSTIC NOISE IN AUDIO DEVICE USING ASYNCHRONOUS REFERENCE SIGNAL // Izvestiya Vysshikh Uchebnykh Zavedeniy. Priborostroenie. 2013. Vol. 56, N 2. P. 11-18 (in Russian) More

  • Solomennik A. I., Chistikov P., Rybin S. V.,Talanov A. O., Tomashenko N. A. AUTOMATION OF NEW VOICE CREATION PROCEDURE FOR A RUSSIAN TTS SYSTEM // Izvestiya Vysshikh Uchebnykh Zavedeniy. Priborostroenie. 2013. Vol. 56, N 2. P. 29-32 (in Russian) More

  • Aleinik S.V., Simonchik K.K. ALGORITHMS FOR DETECTION OF TYPICAL NOISES AND INTERFERING BURSTS IN SPEECH SIGNALS // Izvestiya Vysshikh Uchebnykh Zavedeniy. Priborostroenie. 2013. Vol. 56, N 2. - P. 18-24 (in Russian) More

  • Solomennik A. I., Talanov A. O., Solomennik M. V., Khomitsevich O. G., Chistikov P. ASSESSMENT OF SYNTHESIZED SPEECH QUALITY: PROBLEMS AND SOLUTIONS // Izvestiya Vysshikh Uchebnykh Zavedeniy. Priborostroenie. 2013. Vol. 56, N 2. P. 38-42 (in Russian) More

  • Kozlov A., Kudashev O., Matveev Y., Pekhovsky T., Simonchik K.K., Shulipa A.K.

    SVID speaker recognition system for NIST SRE 2012 // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2013, Vol. 8113, No. LNAI, pp. 278-285 More

  • Akhunzyanov R.R., Tropchenko A.J. ADAPTIVE SKIN DETECTOR DEVELOPMENT // Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2013, no. 5, pp. 103-107 (in Russian). More

  • Чистиков П.Г.

    Using statistical methods for prosodic boundary detection and break duration prediction in a Russian TTS system//International Conference on Computational Linguistics, Dialog-2013, IET - 2013, pp. 11-19

  • Чистиков П.Г.

    Combining HMM and unit selection tech nologies to increase naturalness of synthesized speech//International Conference on Computational Linguistics, Dialog-2013, IET - 2013, pp. 2-10

  • Столбов М.Б.

    Speech and Crosstalk Detection for Robust Speech Recognition Using a Dual Microphone System//Proc. of 15-th International Conference on Speech and Computer, SPECOM 2013, IET - 2013, pp. 310-318

  • Чистиков П.Г.

    Evaluation of naturalness of synthesized speech with different prosodic models//International Conference on Computational Linguistics, Dialog-2013, IET - 2013, pp. 30-35

  • Чистиков П.Г.

    Improving Prosodic Break Detection in a Russian TTS System//15th International Conference, SPECOM 2013 Proceedings, IET - 2013, Vol. 8113, pp. 181-188

  • Kudashev O.Y., Kozlov A.

    The diarization system for an unknown number of speakers // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2013, Vol. 8113, No. LNAI, pp. 340-344 More

  • Khitrov M.

    Talking passwords: voice biometrics for data access and security // Biometric Technology Today - 2013, Vol. 2013, No. 2, pp. 9-11 More

  • Tropchenko A.Y., Balakshin P., Sadovnikov E.

    Usage of the speech recognition system in analysis of call center work // Proceedings in Conference of Informatics and Management Science - 2013, Vol. 2, No. 1, pp. 277-280 More

  • Simonchik K.K., Shulipa A., Pekhovsky T.S.

    Effective Estimation of a Multi-Session Speaker Model using Information on Signal Parameters // Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH - 2013, No. 2013, pp. 1604-1608

  • Matveev Y.N.

    The Problem of Voice Template Aging in Speaker Recognition Systems // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2013, Vol. 8113, No. LNAI, pp. 345-353 More

  • Chistikov P., Khomitsevich O.

    Improving Prosodic Break Detection in a Russian TTS System // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2013, Vol. 8113, No. LNAI, pp. 181-188 More

  • Tatarnikova M., Stolbov M.

    Speech and crosstalk detection for robust speech recognition using a dual microphone system // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2013, Vol. 8113, No. LNAI, pp. 310-318 More

  • Khitrov M., Beldiman L., Vasiliev A.

    Statistical Language Aspects of Intonation and Gender Features Based on the Lithuanian Language // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2013, Vol. 8113, No. LNAI, pp. 327-332 More

  • Shchemelinin V., Simonchik K.K.

    Examining vulnerability of voice verification systems to spoofing attacks by means of a TTS system // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) - 2013, Vol. 8113, No. LNAI, pp. 132-137 More

  • Khomitsevich O. G., Rybin S. V., Anichkin I. M. APPLICATION OF LINGUISTIC ANALYSIS FOR TEXT NORMALIZATION AND HOMONYMY RESOLUTION IN RUSSIAN TEXT-TO-SPEECH SYSTEM // Izvestiya Vysshikh Uchebnykh Zavedeniy. Priborostroenie. 2015. Vol. 56, N 2. P. 42—46 (in Russian). More

  • Smirnova N. S., Khitrov M. V. A PHONETICALLY RICH TEXT FOR FUNDAMENTAL AND APPLIED RESEARCH ON RUSSIAN SPEECH VARIABILITY // Izvestiya Vysshikh Uchebnykh Zavedeniy. Priborostroenie. 2015. Vol. 56, N 2. P. 5—10 (in Russian). More

  • Matveev Yu. EVALUATION OF THE CONFIDENCE INTERVAL FOR DECISION PREDICTION OF AN ENSEMBLE OF CLASSIFIERS // Izvestiya Vysshikh Uchebnykh Zavedeniy. Priborostroenie. 2013. Vol. 56, N 2. - P. 74-79 (in Russian) More

  • Dyrmovsky D. V., Koval Sergey L. FEATURES OF HUMAN-MACHINE INTERFACE OF MODERN BIOMETRIC IDENTIFICATION SYSTEMS // Izvestiya Vysshikh Uchebnykh Zavedeniy. Priborostroenie. 2013. Vol. 56, N 2. - P. 66-74 (in Russian) More

  • Matveev Yu. N. STUDY OF INFORMATIVE SPEECH FEATURES FOR AUTOMATIC SPEAKER IDENTIFICATION // Izvestiya Vysshikh Uchebnykh Zavedeniy. Priborostroenie. 2013. Vol. 56, N 2. - P. 47-51 (in Russian) More

  • Bibikov S. V., Markisonov M. E., Panasyuk S. A. MODERN MOBILE SYSTEM FOR TRACK WARNING // Izvestiya Vysshikh Uchebnykh Zavedeniy. Priborostroenie. 2013. Vol. 56, N 2. - P. 24-28 (in Russian) More

  • A. V. Kozlov, O. Kudashev, Yu. N. Matveev, T. S. Pekhovsky, K. K. Simonchik, А. K. Shulipa, “Speaker recognition system for the NIST SRE 2012”, Tr. SPIIRAN, 25 (2013), 350–370 (in Russian) More

  • Tropchenko A.Y., Ahunzyanov R.R.

    Hand detection based on skin color segmentation and classification of image local features // Tem Journal TECHNOLOGY EDUCATION MANAGEMENT INFORMATICS - 2013, Vol. 2, No. 2, pp. 150-155

  • Kukharev G.A., Kamenskaya E.I., Matveev Y.N., Shchegoleva N.L. Methods of facial images processing and recognition in biometrics. - SPb.: Politechnika, 2013, 388 p.

2012 year
  • Шуранов Е.В., Петров Г.А.

    Практика использования вейвлет-анализа в дефектоскопии. Учебное пособие. - СПб : Балт. гос. техн. ун-т. - 2012

  • Кудашев О.Ю., Пеховский Т.С.

    Проблемы инициализации систем сегментации дикторов на основе вариационного байесовского анализа // Научно-технический вестник информационных технологий, механики и оптики - 2012. - № 3(79). - С. 83-86

  • Шулипа А.К., Симончик К.К., Пеховский Т.С.

    Supervized Mixture of PLDA Models for Cross-Channel Speaker Verification // in Proc. Interspeech'12, Portland, USA - 2012

  • Столбов М.Б., Алейник С.В.

    Semi-Automated Technique for Noisy Recording Enhancement Using an Independent Reference Recording//42th Int. Conf. AES, Audio Forensics, IET - 2012, pp. 57-64

  • Matveev Y., Goloshchapova T., Raev A.N.

    Raev A.N., Matveev Y., Goloshchapova T.The Effect of Use of Drugs on Speaker’s Fundamental Frequency and Formants//Proc. Interspeech 2012, IET - 2012, pp. 1311-1314

  • Столбов М.Б.

    Speech Enhancement Technique for Low SNR Recording//42th Int. Conf. AES, Audio Forensics, IET - 2012, pp. 23-28

  • Бибиков С.В., Богатырев В.А., Бибиков С.В.

    Оценка функциональной безопасности систем, связанных с безопасностью // Технико-технологические проблемы сервиса - 2012. - № 4(18). - С. 45

  • Aleinik S. V., Matveev Y. N., Raev A. N. EVALUATION METHOD OF SPEECH SIGNAL CLIPPING LEVEL // Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2012, no. 3, pp. 79-83 (in Russian).

  • Bibikov S. V., Shapar A. V. MOVING TRAIN AS A SOURCE OF ACOUSTIC WAVES PROPAGATING IN THE RAILWAY TRACK // Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2012, no. 5, pp. 152-153 (in Russian).

  • Matveev Y. N., Shulipa A. K. HISTOGRAM NORMALIZATION OF SPEECH FEATURES FOR SPEAKERS’ VERIFICATION // Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2012, no. 6, pp. 85-88 (in Russian).

2011 year
  • Пеховский Т.С.

    Variational Bayesian Model Selection for GMM-Speaker Verification using Universal Background Model // Proc. Interspeech'11, Florence, Italy, Aug. 2011 - 2011

  • Chistyakov P., Rybin S. Speech synthesis systems // Computer Tools in Education - 2011. - N1. - pp. 22-30

  • Чистиков П.Г., Рыбин С.В.

    Системы синтеза речи // Компьютерные инструменты в образовании - 2011. - № 1. - С. 22-30

  • Коваль С.Л., Пеховский Т.С., Смирнова Н.С., Столбов М.Б., Таланов А.О., Хитров М.В.

    «Фоноскопическое исследование фонограмм речи: Исследование достоверности фонограмм» -2011

  • Симончик К.К.

    Метод и алгоритмы текстонезависимой верификации дикторов по голосу. Исследование метода и алгоритмов системы верификации по голосу, устойчиво работающей в различных каналах связи -2011

  • Matveev Y.N., Goloshchapova T., Raev A.N.

    Raev A.N., Matveev Y.N., Goloshchapova T.The Effect of Use of Drugs on Speaker’s Fundamental Frequency//SPECOM-2011: 14th International conference on SPEECH and COMPUTER, IET - 2011, pp. 308-314

2008 year
  • Rybin S. Discrete mathematics - 2008

  • Рыбин С.В.

    Дискретная математика - 2008

Information © 2015-2018 ITMO University
© 2015 Department of Information Technology