Deepgram
Deepgram — ведущая платформа голосового ИИ для разработчиков, предоставляющая API для распознавания речи (STT), синтеза речи (TTS) и создания голосовых агентов.
О компании
Deepgram основана в 2015 году Скоттом Стефенсоном и его коллегами — бывшими физиками из Мичиганского университета. Компания началась с исследований машинного обучения для анализа звуковых волн в детекторе тёмной материи, а затем переориентировалась на речевые технологии, обнаружив пробел на рынке распознавания речи. С самого начала Deepgram сделала ставку на сквозное глубокое обучение вместо традиционных эвристических подходов.
Сегодня Deepgram является ведущей платформой голосового ИИ: более 200 000 разработчиков используют её модели для создания продуктов на базе речи. Компания предлагает API для преобразования речи в текст (STT), текста в речь (TTS) и полноценных голосовых агентов (STS). Флагманские модели — Nova-3 для транскрипции и Aura-2 для синтеза речи, а также уникальная модель Flux — первая в мире conversational speech recognition модель для голосовых агентов реального времени.
Deepgram позиционирует себя как фундаментальную ИИ-компанию с миссией обеспечить каждый разговор между человеком и машиной с помощью продвинутого голосового ИИ. Компания работает по принципу remote-first, имеет свыше 400 корпоративных клиентов, партнёрства с NVIDIA, Amazon AWS и IBM, и привлекла в общей сложности более 234 млн долларов финансирования, включая раунды от Y Combinator, Tiger Global и других инвесторов.