SAPIとは何ですか?何のために必要ですか? |
Speech Application Programming Interface または SAPIは、プログラムがコンピューターのスピーチシンセサイザーを使えるようにするために、Microsoftによって開発された音声機能のことです。
2つの主なSAPIのバージョン (SAPI 4 と SAPI 5)があり、これらはお互い互換性がありません。
オペレーティングシステムWindows 2000はSAPI 4が含まれており、Windows XPとそれ以降のバージョンはSAPI 5です。
SAPIの両方のバージョンを1台のコンピューターにダウンロードしてインストールできます。こうすることで、全ての音声 (古いのも新しいのも) を使うことができます。
SAPI 4をどこで見つけられますか? |
SAPI 4の音声を使うためにMicrosoft Speech API 4.0の機能をダウンロードしてインストールする必要があります。
また、Microsoft Speech Control Panelをダウンロードしてインストールできます。この後、コントロールパネルに音声設定のアイコンバーが加わります。 |
SAPI 5をどこで見つけられますか? |
Windows XP(それ以降のバージョンも)はすでにSAPI 5が含まれています。 |
私のコンピューターにどんな音声がダウンロードされているか、どうしたら分かりますか? |
Control Panel (コントロールパネル)
Speech (音声)
Speech Properties (音声のプロパティ)
Text To Speech (テキストを音声に変換)
Voice selection (音声の選択)。 |
どのように「サイレント設定」のインストールをしますか? |
「サイレント設定」インストールとは、ダイヤログが表示されることなくソフトのインストールです。コマンドラインには-silentキーを入力すれば「サイレント設定」のインストールする可能です。 |
わたしのコンピュータには、2つのサウンドカードがダウンロードされています。音声を再生するために必要なオーディオデバイスは、どうやって選ぶのですか? |
Windowsのコントロールパネルで、オーディオデバイスの選択ができます。例えば、「音、音声、オーディオデバイス」のセクションや、「音声出力 」 ("Audio Output")のボタンで選択します。SAPI 5の音声のためのサウンドカードは、Balabolkaの音声設定パネル(「オーディオ」ボタン)でも選べます。 |
DjVuファイル形式のプログラムを開くと、テキストがありません。どうしてですか? |
DjVuフォーマットは、スキャンした文書を保存するために設計されました。つまり、DjVuファイルでは、本のページや雑誌などのイメージが圧縮された形で保存されています。また、DjVuファーマットは 、テキスト(OCR)レイヤーを持つことができます。テキストレイヤーを含むファイルは、時々DjVu+OCRと書かれます。Balabolkaは、テキストレイヤーからデーターのみ抽出することができます。もし、テキストレイヤーが使用できない場合、テキストを抽出する唯一の方法は、OCRを実行することです。例えば、FineReaderなどのOCRを実行します。 |
別々のオーディオファイルに、テキストファイルの各文字列を記録させるにはどうしたらいいですか? |
次のような方法があります。各文字列の後に、2つずつ空の文字列をテキストファイルに追加してください。これはMS Wordでします。このエディタでファイルを開き、「検索 と置換」のウィンドウを開き、フィールドの「検索」に^pを書き、フィールドの「置換」に^p^p^pを書き、「全て置換」のボタンを押してください。そして、テキストファイルを保存してください。その後、Balabolkaでメインメニューの「分割してのオーディオファイルに保存」のところを開いてください。ウィンドウに会話が現れたら、テキスト分割方法を選んでください。2つ連続した空の文字列を探す。この後、オーディオファイルの書き込みを始めることができます。 |
Google Text-To-Speechとは何ですか? |
Googleサービスのオンライン翻訳を使用する場合は、翻訳されたテキストの隣の"Listen"(「音声を聞く」)のボタンがあります。それを押すと、ブラウザはGoogleサイトから音声された翻訳のMP3形式のオーディオファイルをダウンロードします。音声合成は、30以上の言語で利用可能です。このサービスは、100文字以内のテキストを音声することができます。Balabolkaのプログラムは、この制限を削除することができます。大きなテキストは小さく分割され、テキストの各部分のオーディオファイルをダウンロードし、その後、すべてのファイルが1オーディオファイルに結合されます。 |
Balabolkaのソフトで電子書籍を開きますが、ウィンドウ内のテキストがありません。なぜですか? |
その理由はいくつかあります。第一に、ファイルは、紙の本をスキャンしたページ画像のセットだからです。第二に、電子書籍は、DRMの保護があります。Balabolkaのプログラムは、このような保護機能を備えた本からのテキストを抽出することができません(違法になります)。 |
Spritzの読む方法とは何ですか? |
Spritzは、アメリカの会社Spritzが開発した速読技術です。これを読む方法は、個々の単語にテキストを分割し、色付きの最適な識別の点を用いて、連続的にその単語を表します。これは特別なトレーニングなしで毎分最大1000の単語の読み出し速度を達成させられます。この技術の基本原理は、視線は単語から次の単語へ移動するためにかなり時間がかかります。Spritzの技術は、ユーザに連続的に単語を見せることで眼球運動がほぼゼロに低減される効果を得られます。その他は、単語を処理し、互いに関連付けることができる人間の脳の読む速度の能力によります。 |
Windows 10 has the new voices Microsoft Ayumi Mobile and Microsoft Ichiro Mobile, but they are not available in text-to-speech software. Is it possible to unlock the new voices? |
By default, the Microsoft mobile voice (also known as "OneCore") is locked for using in text-to-speech software via SAPI 5. You can unlock it with a simple registry tweak. Download the archive, extract the file for your language and for your version of the operating system ("mobile_x86.reg" for 32bit and "mobile_x64.reg" for 64bit), click the right mouse button on the file's name and choose the context menu item "Merge". The Microsoft mobile voice will appear in the list of the available voices in Balabolka.
Alternatively, the utility SAPI Unifier can be used for the same purpose. |
Windows 11 introduces more natural voices, such as Microsoft Jenny and Microsoft Aria. How can I access them with SAPI 5? |
This problem can be fixed with the NaturalVoiceSAPIAdapter utility. It will add new speech engines to the SAPI 5 voice list; it can also add the voices available in the Microsoft Edge browser to this list. More information can be found here. Since Balabolka is a 32-bit application, you should install the 32-bit and 64-bit versions of the utility (see "Installation Status" in the utility's window). You can download the latest release of the utility. |
I have Windows 11 24H2 installed on my computer. In Balabolka, I press the "Read aloud" button: the application reads the first two words in the text and crashes out. Why does this happen? |
Here's what we know about the problem that appears after installing the 24H2 update for Windows 11: if the user's monitor contains speakers, if the graphics card and the monitor are connected by a cable that transmits sound – this leads to unstable work of the Balabolka program, it periodically crashes, and in the event log the MMDevApi.dll system library is specified as the cause of the crash. But if you connect speakers or headphones to the audio jack on the motherboard of the same computer, the Balabolka program works stably.
The problem occurs in 32-bit applications that use the IMMNotificationClient interface. Until Microsoft developers fix the problem, here's the situation: if you installed the 24H2 update for Windows 11 and the text-to-speech application starts crashing, connect your audio output device to a different port on your computer. I wrote to Microsoft support about this situation, but they ignored my messages. We all have to wait for Microsoft developers to fix the problem.
A user from Japan, Ikuo Kurihara, found one more way to fix the problem: first you need to launch Windows Media Player Legacy (click the "Start" button and type this name in the search bar), open any audio file in the player, start playing it and immediately pause; then launch Balabolka. In this case, the text-to-speech application will work stably. "Windows Media Player Legacy" is a 32-bit application, just like Balabolka. This method will also work with any other 32-bit audio player. |