Аудиотранскрипция и протоколы собраний
AI-School предлагает мощные возможности транскрипции аудио в текст с использованием реального времени API OpenAI. Транскрипция выполняется в режим е реального времени, чтобы вы могли сразу проверить, правильно ли отображается текст. Кроме того, можно автоматически составлять протоколы собраний на основе транскрипции.
Начальный экран
На начальном экране модуля транскрипции вы можете выбрать между новой записью в реальном времени или загрузкой существующего аудиофайла.

Подача аудио
Есть два способа предоставить аудио для транскрипции:
Прямой захват в AI-School
Нажмите на большую кнопку "Начать запись", чтобы начать запись в режиме реального времени. Прежде чем запись начнется, появится диалоговое окно с настройками записи:
Настройки записи
При запуске записи можно сконфигурировать различные настройки:
-
Тип записи: Выберите тип записи для оптимизации качества аудио:
- Личная запись: Для одного человека близко к микрофону (подкасты, личные заметки)
- Совещание (по умолчанию): Для нескольких говорящих в помещении
- Урок или презентация: Для главного докладчика с возможным взаимодействием
В зависимости от выбора будет применяться подходящий аудио-фильтр:
- Фильтр ближнего поля для личных записей
- Без фильтра для совещаний (чтобы уловить всех говорящих)
- Фильтр дальнего поля для уроков и презентаций
-
Запись аудио: Выберите, хотите ли сохранять аудио во время транс крипции
- Да: Аудио сохраняется в Firebase Storage
- Нет: Только текст транскрипции сохраняется
-
Интервал загрузки аудио (только если выбран режим записи аудио):
- Установите интервал (1-15 минут), с которым аудио сохраняется
- По умолчанию: 5 минут
- Более короткие интервалы (например, 1-2 мин): больше аудиофайлов, но безопаснее в случае сбоев компьютера
- Длиннее интервалы (например, 10-15 мин): меньше файлов, но риск потери при технических проблемах
Во время записи каждый фрагмент аудио автоматически сохраняется как файл и обрабатывается. Это позволяет AI-School также при длительных записях сохранять транскрипцию по мере выполнения. Последний фрагмент аудио сохраняется и обрабатывается при остановке записи.
Если обработка аудиофрагмента завершается неуспешно, этот файл помечается как с ошибкой. Сам процесс записи может продолжаться; после завершения проверьте, что все части обработаны корректно.
Использовать существующий аудиофайл
Вы также можете загрузить ранее записанный аудиофайл в AI-School. Нажмите кнопку "Выбрать аудиофайл" и выберите файл. Поддерживаемые форматы: MP3, WAV, M4A и WebM. После загрузки файл автоматически обрабатывается, чтобы транскрипция стала доступной, когда обработка завершится.

Живая транскрипция
Во время транскрипции AI-School использует модель речи в реальном времени. Это означает, что вы можете читать текст онлайн или что транскрипция отображается корректно. В зависимости от выбранного провайдера AI-School может также сохранять аудиофрагменты и обрабатывать их в фоне.
Внимание: если транскрипция не на 100% совпадает с произнесенным текстом:
- Говорите яснее и лучше артикулируйте
- Убедитесь, что используете хороший микрофон
- Убедитесь, что микрофон расположен достаточно близко к говорящему
- Выберите правильный тип записи в настройках
Протоколы собраний
После записи и транскрипции можно автоматически составлять протоколы собраний. Переключитесь на вкладку "Протоколы собраний" и нажмите кнопку "Сформировать протоколы собраний".

Протоколы собраний автоматически составляются на основе транскрипции и активного запроса.
Расширенные настройки
Управление подсказками
Вы можете полностью настраивать и управлять подсказками для протоколов собраний. Нажмите кнопку "Настроить подсказку", чтобы открыть диалог подсказки.

Стандартные подсказки
AI-School предлагает две стандартные подсказки:
- Стандартная встреча: создает структурированные протоколы собраний с общими разделами
- С распознаванием спикера: создаёт протоколы собраний с распознаванием спикеров и присваивает каждому спикеру уникальный номер