Перейти к основному содержимому

Аудиотранскрипция и протоколы собраний

AI-School предлагает мощные возможности транскрипции аудио в текст с использованием реального времени API OpenAI. Транскрипция выполняется в режиме реального времени, чтобы вы могли сразу проверить, правильно ли отображается текст. Кроме того, можно автоматически составлять протоколы собраний на основе транскрипции.

Начальный экран

На начальном экране модуля транскрипции вы можете выбрать между новой записью в реальном времени или загрузкой существующего аудиофайла.

Начальный экран транскрипции

Подача аудио

Есть два способа предоставить аудио для транскрипции:

Прямой захват в AI-School

Нажмите на большую кнопку "Начать запись", чтобы начать запись в режиме реального времени. Прежде чем запись начнется, появится диалоговое окно с настройками записи:

Настройки записи

При запуске записи можно сконфигурировать различные настройки:

  1. Тип записи: Выберите тип записи для оптимизации качества аудио:

    • Личная запись: Для одного человека близко к микрофону (подкасты, личные заметки)
    • Совещание (по умолчанию): Для нескольких говорящих в помещении
    • Урок или презентация: Для главного докладчика с возможным взаимодействием

    В зависимости от выбора будет применяться подходящий аудио-фильтр:

    • Фильтр ближнего поля для личных записей
    • Без фильтра для совещаний (чтобы уловить всех говорящих)
    • Фильтр дальнего поля для уроков и презентаций
  2. Запись аудио: Выберите, хотите ли сохранять аудио во время транскрипции

    • Да: Аудио сохраняется в Firebase Storage
    • Нет: Только текст транскрипции сохраняется
  3. Интервал загрузки аудио (только если выбран режим записи аудио):

    • Установите интервал (1-15 минут), с которым аудио сохраняется
    • По умолчанию: 5 минут
    • Более короткие интервалы (например, 1-2 мин): больше аудиофайлов, но безопаснее в случае сбоев компьютера
    • Длиннее интервалы (например, 10-15 мин): меньше файлов, но риск потери при технических проблемах

Во время записи каждый фрагмент аудио автоматически сохраняется как файл и обрабатывается. Это позволяет AI-School также при длительных записях сохранять транскрипцию по мере выполнения. Последний фрагмент аудио сохраняется и обрабатывается при остановке записи.

Если обработка аудиофрагмента завершается неуспешно, этот файл помечается как с ошибкой. Сам процесс записи может продолжаться; после завершения проверьте, что все части обработаны корректно.

Использовать существующий аудиофайл

Вы также можете загрузить ранее записанный аудиофайл в AI-School. Нажмите кнопку "Выбрать аудиофайл" и выберите файл. Поддерживаемые форматы: MP3, WAV, M4A и WebM. После загрузки файл автоматически обрабатывается, чтобы транскрипция стала доступной, когда обработка завершится.

Начало с аудиофайлом

Живая транскрипция

Во время транскрипции AI-School использует модель речи в реальном времени. Это означает, что вы можете читать текст онлайн или что транскрипция отображается корректно. В зависимости от выбранного провайдера AI-School может также сохранять аудиофрагменты и обрабатывать их в фоне.

Внимание: если транскрипция не на 100% совпадает с произнесенным текстом:

  • Говорите яснее и лучше артикулируйте
  • Убедитесь, что используете хороший микрофон
  • Убедитесь, что микрофон расположен достаточно близко к говорящему
  • Выберите правильный тип записи в настройках

Протоколы собраний

После записи и транскрипции можно автоматически составлять протоколы собраний. Переключитесь на вкладку "Протоколы собраний" и нажмите кнопку "Сформировать протоколы собраний".

Протоколы собраний

Протоколы собраний автоматически составляются на основе транскрипции и активного запроса.

Расширенные настройки

Управление подсказками

Вы можете полностью настраивать и управлять подсказками для протоколов собраний. Нажмите кнопку "Настроить подсказку", чтобы открыть диалог подсказки.

Настроить подсказку

Стандартные подсказки

AI-School предлагает две стандартные подсказки:

  1. Стандартная встреча: создает структурированные протоколы собраний с общими разделами
  2. С распознаванием спикера: создаёт протоколы собраний с распознаванием спикеров и присваивает каждому спикеру уникальный номер

Собственные подсказки

Вы также можете создать свои собственные подсказки:

  • Нажмите "Добавить собственную подсказку"
  • Дайте подсказке имя
  • Опишите инструкции о том, как должны формироваться протоколы собраний
  • Сохраните подсказку

Все собственные подсказки сохраняются в вашей учётной записи и доступны для будущих транскрипций.

Управление историей

Вы можете просматривать и управлять историей ранее созданных транскрипций с помощью кнопки "История".

Управление историей

В истории можно:

  • Поиск транскрипций по названию, дате или содержимому
  • Редактировать заголовки кликом по значку карандаша
  • Загружать транскрипции для повторного просмотра или редактирования
  • Удалять транскрипции, которые больше не нужны
  • Воспроизводить аудио, если транскрипция содержит аудио-записи

Transcriptie ingeladen

Использование транскрипции

Вы можете использовать транскрипцию различными способами:

  • Копировать: скопируйте транскрипцию кнопкой копирования
  • Экспорт в PDF: загрузите транскрипцию в виде PDF-документа
  • Использовать в чате: вставьте транскрипцию в чат для вопросов или анализа
  • Экспорт протоколов собраний: экспортируйте протоколы собраний в PDF или Word

Автоматические аудиоделы

Во время живой транскрипции AI-School может сохранять аудио по частям. Эти части загружаются и обрабатываются в фоновом режиме, чтобы длинные записи лучше защищались в случае прерывания соединения, браузера или устройства.

Интервальная загрузка не останавливает живую запись. Каждый интервал сохраняется как самостоятельный WAV-аудиофайл, чтобы сервис обработки получил полноценный и действительный аудиофайл. Последняя часть также сохраняется, когда вы останавливаете запись.

Если обработка аудиофрагмента завершается неуспешно, запись может продолжаться. По завершении проверьте статус файлов и загрузку, или повторно обработайте фрагмент при необходимости.