オーディオブック・クリエイターを起動するには、 デスクトップのアイコン をダブルクリックするか、 スタートメニューのプログラム一覧から 「Audio Book Creator」を選択します。
オーディオブック・クリエイターの画面は、3つの部分からなっています。 まず画面上部に操作ボタンの列が表示されています。 画面左側には取り込んだページの一覧が縮小表示され、 画面右側には読み上げのための文章 (原稿) が表示されています。
オーディオブック・クリエイターでは、 以下の手順でオーディオブックを作成します:
お持ちのスキャナあるいは電子書籍スキャン代行等のサービスを使って、 書籍をスキャンします。
オーディオブック・クリエイターでは、TWAIN対応のスキャナに対応しています。 未対応の機種をお持ちの場合でも、スキャンした文書を JPEG形式、 PDF形式あるいはTIFF形式として保存することができれば、 オーディオブック・クリエイターでの取り込みが可能です。
画面上の ボタンをクリックすると、 お使いのPCに接続されているスキャナから画像の取り込みが始まります。 スキャナが自動紙送り器 (ADF) に対応している場合は、 自動紙送り器から印刷物が取り込まれます。
スキャナから取り込んだ画像は、画面左側のページ一覧に順次追加されていきます。 以後、書籍中のスキャンしたいページに対して、この作業を繰り返します。
書籍によっては、見開きページがお互いに傾いて印刷されている場合があります。 このような場合は左右のページを別々にスキャンしてください。
電子書籍スキャン代行等のサービスを使う場合は、 PDF形式あるいはTIFF形式での受け取りをご指定ください。
「ファイル」メニューから 「画像の読み込み...」を選択し、 取り込んだファイルを指定します。あるいは、 画面左側のページ一覧に画像ファイルを 直接ドラッグ・ドロップして読み込むことも可能です。 読み込んだ画像は、ページ一覧に順次追加されていきます。
スキャンが完了したら、合成音声のための読み上げ原稿を作成します。 スキャンした画像は、OCR (光学的文字認識) という処理により 文字情報に変換されます。オーディオブック・クリエイターでは、 この文字情報を使って、読み上げのための文章を作成します。 これを「原稿」と呼びます。 この原稿を合成音声で読み上げたものがオーディオブックになります。
画面上の ボタンをクリックすると、 取り込んだ画像から認識された文章が画面右側の原稿として現れます。
あるいは、画面左側の画像をクリックして、 1ページずつ右側にドラッグ・アンド・ドロップしても原稿を作成できます。
オーディオブック・クリエイターでは、ページ中で 文字の書かれているまとまり (領域) を認識します。 通常は、書籍の内容に関係のない領域 (ページ番号など) は自動的に原稿から除かれます。 しかし、本来文字ではない部分が誤って原稿に混じったり、 一部の見出しなどが原稿から抜け落ちている場合があります。 このような場合は、取り込んだ画像の中から 原稿に含めたい領域だけを選択することができます。
画面左側のページの画像をクリックすると、そのページが選択されます。 ここで、文字が書かれている領域が枠で表示されます。 赤い枠で 囲まれている部分が原稿に含まれる部分、 青い枠で 囲まれている部分が原稿に含まれない部分です。 これらの枠をクリックすると、青い枠と赤い枠が交互に切り替わります。 このようにして、ページ中の原稿に含めたい部分だけを指定することができます。
変更したいすべてのページでこの作業をおこなったあと、 ふたたび「原稿の自動作成」ボタンを押してください。
文字認識処理は完璧ではないため、認識された文字には多少の 誤りが含まれることがあります。また、本来文字ではない部分が 文字と誤認識されて、原稿中に意味のない文字列が混じることがあります。 そのため、自動で作成された原稿を手入力で修正する必要があるかもしれません。 このような場合は、画面右側に表示されている原稿を、 マウスとキーボードを使って編集することができます。
原稿が実際の合成音声でどのように 読み上げられるかを確認するには、読み上げたい部分を選択して ボタンを押します。 選択された部分の文字が読み上げられます。 読み上げの際の音声や速さを変更するには、 読み上げの速さや声を変えるには?を参照してください。
すべての作業が完了したら、 ボタンをクリックします。 音声合成処理が開始され、作成した原稿からMP3ファイルが生成されます。 オーディオブックの生成が終わると、自動的に完成したMP3ファイルの 入ったフォルダが開かれます。あとはこのMP3ファイルをお手持ちの 携帯型プレイヤーなどにコピーしてお楽しみください。 なお、生成されるMP3ファイルのビットレートは 48kbps で、 たとえば 1時間の内容を読み上げた場合、約20メガバイトのMP3ファイルができあがります。