おれさまラボの実験ノート

実際に手を動かして理解を深めるブログ。

家に溢れている技術書を電子書籍化してみた

はじめに

本が多すぎてひとり暮らしのワンルームには手狭になってきたので、本をスキャンして電子書籍化することにしました。ScanSnap iX1500 も持ってはいるのですが、さすがに冊数が多くて自分でやるのは嫌だったので今回は外注することにしました。

BOOKSCAN

外注先として BOOKSCAN を利用してみました。

www.bookscan.co.jp

選んだ理由としてはお手軽そうだったこと、OCR まで含んだ単価が安いこと、Web 上で口コミ検索して評判が良さそうだったことの3点です。

BOOKSCAN とは

BOOKSCAN は、蔵書を電子書籍化 + 廃棄処分してくれるサービスです。自宅から書籍を BOOKSCAN に送ることもできますし、Amazon 等で購入した書籍を直接 BOOKSCAN に送ることもできます。

使い方

BOOKSCAN の使い方について紹介します。

会員登録

まずは会員登録しましょう。会員登録は無料です。

BOOKSCAN ではプレミアム会員制度があり、月 50 冊までのスキャンサービスが受けられます。9,505 円 + 税 / 月とそれなりな金額がかかりますが、納期も 1 週間程度で済みますし、大量の本がある場合はプレミアム会員のほうが割安なので自分はプレミアムを選びました。

発送

家にある本をとにかく処分したかったので、120 サイズのダンボール箱に入るだけの本を突っ込みました。自分の場合は、ほとんどが技術専門書で 50 冊入りました。

のちほど記載しますが、BOOKSCANの 1 冊は物理的な 1 冊ではないので注意してください。

箱詰めしたらヤマト宅急便に集荷依頼1をします。集荷依頼も最近はスマホで出来ちゃうので便利ですね。このときの住所は BOOKSCAN 申込時に指定された住所にします。

プレミアム会員の場合は、No.<6桁の数字> ‐ <氏名> という宛名が用意されます。Amazon 等から直接書籍を送る場合は、この宛名を使えばいい感じです。

受け取り確認 & スキャン冊数確認

BOOKSCAN 側に本が届くと、受け取り冊数確認メールが届きます。申し込み時に指定した冊数やプレミアム会員の 50 冊まで無料という制限を超えていた場合、サポートセンターから問合せページを通じて連絡が来て、超えた冊数分をどう扱うか問われます。

選択肢は以下表を確認してください。金額は税抜です。

返送作業料 元払い送料 書籍小分け作業料・保管料
超過分ご返送プラン
翌月プレミアムとしてご登録プラン
100円/冊
1週間以内の納品(お急ぎスキャン) プラン
350円/冊

今回は 22 冊分超過だったのと、宅内にまだスキャンしてもらいたい本があるので「翌月プレミアムとしてご登録プラン」を選びました。追加費用は銀行振込でした。振り込みもスマホから簡単にできるのでサクッとお支払いしてスキャンを待ちます。いい時代ですね。

スキャン完了

スキャンが完了するとその旨を伝えるメールが届きます。

BOOKSCAN にアクセスすると、本棚にスキャン済みの書籍が並んでいます。

ダウンロード

専用のダウンローダーが用意されていますのでそちらを使ってダウンロードします。

環境にもよると思いますが、自分の環境では 7 ~ 10 Mbps 程度しか出なかったのでそこそこダウンロードには時間がかかりました。「一括ダウンロード」ボタンを押下して別の作業をしておくと良いでしょう。

全体スケジュール感

発送~完了までの流れはこんな感じでだいたい 1 週間で全行程が完了しました。あくまでプレミアム会員の場合の参考値としてご確認ください。

2月29日 書籍を箱詰めして発送
3月1日
3月2日 冊数オーバーについてサポートセンターから連絡あり
希望プランについて回答
追加分の料金を銀行振込
3月3日 振り込み確認 & 正式な到着連絡が届く
3月4日
3月5日
3月6日
3月7日 PDF 化完了連絡が届く

注意すること

冊数のカウント方法

BOOKSCAN では 350 ページまでを 1 冊とカウントします。

www.bookscan.co.jp

技術専門書の場合はだいたい物理的な 1 冊が 1.5 冊~ 2 冊程度としてカウントされますので見積りに注意してください。

PDF データに表紙は含まれない

スキャン済みの冊子には表紙や背表紙は含まれません。表紙含めきれいに電子化したいという方はご注意ください。

裁断済みの書籍は返ってこない

処分までが BOOKSCAN のお仕事なので手元に本は残りません。

品質について

さいごに、品質について触れておきます。

画質

悪くはない、という印象です。

黒白(グレースケール)の場合

読めますが、ちょっと文字がボケている感じです。気になる人は気になるでしょう。

引用:AWK実践入門 (Software Design plus)

こういった背景色もなかなか見た目そのままとはいかないようです。

引用:AWK実践入門 (Software Design plus)

カラーの場合

発色悪目です。とくに黄色や赤のような原色に近い色が淡い感じになっています。こちらも読めますが人によっては気にされるかもしれません。

引用:パケットキャプチャの教科書 (Informatics&IDEA)

OCR

結構良さげです。

本文中の文字

PDF ビューワーでファイルを開き、文字を選択した状態です。

引用:AWK実践入門 (Software Design plus)

この部分のテキストをコピーしたのが以下引用です。正確ですね。

本書をお読みになる前に
・本書に記載された内容は、情報の提供のみを目的としています。したがって、本書を用いた運用は、必ず
お客様自身の責任と判断によって行なってください。これらの情報の運用の結果について、技術評論社お
よび著者はいかなる責任も負いません。
・本書記載の情報は2015年3月時点のものですので、こ利用時には変更されている場合もあります。
・また、ソフトウェアに関する記述は、特に断りのないかぎり、2015年3月時点での最新バージョンをも
とにしています。ソフトウェアはバージョンアップされる場合があり、本書での説明とは機能内容や画面
図などが異なってしまうこともあり得ます。本書ご購入の前に、必ずバージョン番号をご確認ください。

日本語と英数字が異例混じった文ではやや精度が落ちますが、十分優秀と思います。

引用:AWK実践入門 (Software Design plus)

本書で使用しているawkは、ga、vk 3.1.7と、gawk 4 1.1を対象としています。
gan7k 4での新機能については、2章で言及しています。gawk 4になって追加さ
れた機能を使った一部の例は、ga、vk 3系では動作しませんので注意してください。
本書に掲載しているプログラムは、Linux(CentoS 5 5 64bit)、Mac os x
Yosemite 10 10.2での動作を確認しています。動作確認されたOS以外でも、
一般的なLinux等のUnix系の環境であれば、本書の例題は動作することと思い
ます。しかし、文字コードやテキストデータ形式(DOS形式、Unix形式、Mac
形式)などの違いによって、期待の動作と異なる場合には、扱うプログラム・ス
クリプトや対象のデータのテキストタイプ、文字コードセットを確認してくださ
い(テスト環境では、文字コードセットをUTF¨ 8、改行コードをLFで行なって
います)。

図表内の文字

残念ながら、図表内の文字は認識してくれないようです。

引用:AWK実践入門 (Software Design plus)

おわりに

割とお手軽な金額でそこそこのクオリティーで電子化してくれるので良いサービスだと思いました。自宅でやったらめっちゃ時間かかるので、個人的には 1 万円弱/月の金額を払っても全然ありなサービスだと思いました。

以上


  1. ヤマト宅急便でなくても良い。