Вчера Open AI представили модель GPT-4o (о - omni), которая принимает в качестве входных данных любую комбинацию текста, звука и изображения и генерирует любую комбинацию текста, звука и изображения на выходе. Все это обрабатывается одной и той же нейронной сетью, т.е. взимодействие происходит бесшовно и точно. GPT-4o может реагировать на аудиовходы всего за 232 миллисекунды, что аналогично времени реакции человека при разговоре.

Вряд ли вы почувствуете силу этого прогресса на себе в этом году в силу множества обстоятельств, но это первый, действительно большой шаг автоматизации продаж без человека для холодных и даже теплых продаж для товаров с малой наценкой, а также для фитнес-клубов, службы доставки продуктов и еды и проч. Не уверен, что это полноценно заработает в сервисах, которыми вы пользуетесь, но тестирование точно будет. 
Мы в Модуле Роста сейчас используем актуальную модель GPT-4, чтобы помогать людям, в том числе менеджерам по продажам, выстраивать качественное взаимодействие с клиентами, на основе данных и любви к клиентам. Мы безусловно протестируем модель GPT-4o, когда откроется такая возможность, но сохраним наш фокус на создании доступного решения «человек+ИИ», чтобы взять лучшее из двух миров и помочь новым лиделам рынка взять своё быстрее, чем их конкуренты.


Будущее уже сегодня.


@izumov