Google запускает Speech-to-Retrieval: голосовой поиск без распознавания речи

TopG 22 октября 2025

Google запускает Speech-to-Retrieval: голосовой поиск без распознавания речи

1 минута

Новости

Google отметил крупный шаг в развитии поисковых технологий, представив систему, которая обрабатывает голосовые запросы без превращения их в текст.

Новая технология (Speech-to‑Retrieval, S2R) использует модели глубокого обучения, обученные на больших датасетах аудио‑текстовых пар, позволяя искать информацию напрямую по фонетическому материалу.

В отличие от модели Cascade ASR, которая преобразует речь в текст и далее применяет обычные алгоритмы ранжирования, S2R опускает промежуточный перевод, тем самым уменьшая вероятность потери смысловых нюансов и ошибок в индексации.

Алгоритм реализован двумя компонентами: аудиокодером, преобразующим звук в семантический вектор, и кодером документов, выдающим аналогичный вектор из текстовой информации.

Оба кодера обучены распознавать сходство между аудио‑текстовыми запросами в едином пространстве, что обеспечивает более точное соответствие запросов и релевантных результатов.

—

22.10.2025 11:50

Комментарии

Написать комментарий

Нет комментариев. Ваш будет первым!

Ваше имя

E-mail для ответов

Поиск

Google запускает Speech-to-Retrieval: голосовой поиск без распознавания речи