OpenAI готує нову голосову модель для ChatGPT, яка може слухати й говорити одночасно
У коді застосунку ChatGPT помітили згадки про нову голосову модель GPT-Bidi-1. Це може бути двонапрямна аудіомодель, яка здатна одночасно слухати користувача й відповідати голосом, пише Android Authority.
BREAKING : First tests of "Bidi 1", an upcoming bidirectional voice model from OpenAI. This upgrade will arrive in ChatGPT and, potentially, in Codex soon as well.
— AI News TestingCatalog (@testingcatalog) June 23, 2026
> Bidi 1 can speak over while you are talking and keep listening.
> Bidi 1 can switch between tasks back and… https://t.co/BwWhCKx3G0 pic.twitter.com/Fawc74kBym
OpenAI поки що офіційно не анонсувала GPT-Bidi-1. Водночас профільні медіа пишуть, що модель уже почали відкривати для частини користувачів застосунку ChatGPT, а це може свідчити про запуск найближчим часом.
Bidi, ймовірно, є скороченням від bidirectional — «двонапрямний». Такий підхід дозволяє голосовому асистенту не чекати повного завершення репліки користувача, а слухати, говорити й реагувати майже одночасно.
За даними витоків, GPT-Bidi-1 може природніше реагувати на паузи користувача: давати короткі підтвердження на кшталт «окей» або «гаразд», але не перебивати співрозмовника. Також модель нібито зможе швидко змінювати завдання під час розмови. Наприклад, якщо попросити її рахувати до десяти, а потім посеред відповіді попросити рахувати у зворотному порядку, вона має одразу адаптуватися.
Ще однією зміною може стати краща робота з контекстом довгих розмов. За даними Android Authority, модель має утримувати попередні частини діалогу й не втручатися під час більш тривалих пауз.
У витоках також зазначено, що Bidi-1 може з’явитися в меню вибору моделей у налаштуваннях поруч зі стандартним і розширеним голосовими режимами. Після її активації голосова бульбашка змінюватиме колір на жовтий. У внутрішньому коді модель описували як «великий стрибок в інтелекті» й «наступне покоління Voice».
TestingCatalog пише, що GPT-Bidi-1 може стати спробою OpenAI скоротити розрив між сильнішими текстовими моделями й голосовим інтерфейсом ChatGPT. Якщо дані про модель підтвердяться, голосові розмови з ChatGPT можуть стати ближчими до живого діалогу — з природнішими паузами, перебиваннями і продовженням контексту.
Офіційних деталей про GPT-Bidi-1 OpenAI поки що не оприлюднювала.