メインコンテンツへスキップ

音声記録と会議ノート

AI-School は OpenAI のリアルタイム API を用いて、音声をテキストに転換する強力なトランスクリプション機能を提供します。 トランスクリプションはライブで行われるため、テキストが正しく表示されているかを直接確認できます。 さらに、トランスクリプションに基づいて自動的に会議ノートを作成できます。

スタート画面

トランスクリプションモジュールのスタート画面では、新規のリアルタイム録音を選ぶか、既存の音声ファイルをアップロードするかを選択できます。

スタート画面 トランスクリプション

音声の提出

トランスクリプションのための音声提出には、2通りの方法があります。

AI-School で直接録音

大きな「Start Opname(録音開始)」ボタンをクリックして、リアルタイム録音を開始します。録音開始前には、録音設定のダイアログが表示されます。

録音設定

録音を開始する際に、さまざまな設定を構成できます。

  1. 録音タイプ: 音質を最適化するための録音タイプを選択します。

    • プライベート録音: マイクに近い1人向け(ポッドキャスト、個人ノート)
    • 会議(標準): 複数の発言者がいる部屋向け
    • 講義またはプレゼンテーション: 主講者1名と対話の可能性がある場合

    選択に基づき、適切な音声フィルターを適用します:

    • プライベート録音にはネアフィールドフィルター
    • 会議にはフィルターなし(全員を正確に捉えるため)
    • 講義・プレゼンにはフォアフィールドフィルター
  2. 音声の録音保存: トランスクリプション中も音声を保存するかを選択します

    • はい: 音声は Firebase Storage に保存されます
    • いいえ: トランスクリプトのテキストのみが保存されます
  3. 音声アップロード間隔(音声録音を選択した場合のみ):

    • 音声を保存する間隔を設定します(1–15分)
    • デフォルト: 5分
    • 短い間隔(例: 1–2分): 音声ファイルが多くなるが、コンピュータのクラッシュ時に安全
    • 長い間隔(例: 10–15分): ファイル数は少ないが、技術的問題での紛失リスク

録音中、各音声セクションは自動的にファイルとして保存・処理されます。これにより、長時間の録音でも途中でトランスクリプションを確保できます。録音を停止すると、最後の音声セクションもアップロードされ、処理されます。

音声セクションの処理が失敗した場合、そのファイルはエラー状態になります。録音自体は継続できますが、終了後にすべてのセクションが正しく処理されているかを確認してください。

既存の音声ファイルを使用

以前に録音された音声ファイルを AI-School にアップロードすることもできます。 「音声ファイルを選択」ボタンをクリックしてファイルを選択します。サポートされる形式は MP3、WAV、M4A、WebM です。アップロード後は自動的に処理され、処理完了時にトランスクリプションが利用可能になります。

音声ファイルで開始

ライブ トランスクリプション

トランスクリプション中、AI-School はリアルタイムの音声モデルを使用します。これにより、ライブで読み上げを確認することができ、トランスクリプションが正しく表示されているかを確認できます。選択したプロバイダに応じて、AI-School は音声フラグメントを保存してバックグラウンドで処理することもあります。

注意: トランスクリプションが話されたテキストと100%一致しない場合は次のことを行います。

  • よりはっきり話す・明瞭に発音する
  • 良いマイクを使用していることを確認する
  • 発言者の近くにマイクを正しく配置する
  • 設定の録音タイプを適切に選択する

会議ノート

録音とトランスクリプションの後、会議ノートを自動的に作成できます。タブ「会議ノート」に切り替え、「会議ノートを作成」をクリックします。

会議ノート

会議ノートはトランスクリプションとアクティブなプロンプトに基づいて自動的に作成されます。

高度な設定

プロンプトの管理

会議ノート用のプロンプトを完全にカスタマイズ・管理できます。 「プロンプトを設定」ボタンをクリックして、プロンプトダイアログを開きます。

プロンプト設定

デフォルトのプロンプト

AI-School は2つのデフォルトプロンプトを提供します。

  1. 標準会議: 一般的なセクションを含む構造化された会議ノートを作成
  2. スピーカー認識付き: スピーカー認識付きの会議ノートを作成し、各スピーカーに一意の番号を付けます

独自プロンプト

独自のカスタムプロンプトも作成できます。

  • 「独自プロンプトを追加」をクリック
  • プロンプトに名前を付ける
  • 会議ノートをどう作成するかの指示を記述
  • プロンプトを保存

すべてのカスタムプロンプトはアカウントに保存され、今後のトランスクリプションですぐに利用できます。

履歴の管理

以前のトランスクリプションの履歴を表示・管理できる「履歴」ボタン。

履歴の管理

履歴では以下を行えます。

  • タイトル・日付・内容での検索
  • 鉛筆アイコンをクリックしてタイトルを編集
  • 再表示・編集のためのトランスクリプションの読み込み
  • もう不要なトランスクリプションの削除
  • トランスクリプションに音声記録が含まれている場合は再生

トランスクリプション読み込み

トランスクリプションの活用

トランスクリプションはさまざまな用途で利用できます。

  • コピー: コピー用ボタンでテキストをコピー
  • PDF にエクスポート: トランスクリプションを PDF としてダウンロード
  • チャットでの使用: チャットに貼り付けて質問や分析を依頼
  • 会議ノートをエクスポート: PDF または Word にエクスポート

自動音声セグメント

ライブトランスクリプション中、AI-School は音声をセグメントごとに保存します。これらのセグメントはバックグラウンドでアップロード・処理され、長い録音時の接続・ブラウザ・デバイスの中断時にも保護されます。

インターバルアップロードはライブ録音を停止させません。各インターバルは独立した WAV 音声ファイルとして保存され、処理サービスが完全で有効な音声ファイルを受け取ります。録音を停止したときには、最後のセグメントも保存されます。

音声セグメントの処理が失敗した場合、録音自体は継続できます。終了後にファイルステータスを確認し、必要に応じてそのセグメントを再アップロードまたは再処理してください。