蔵書の電子化のすすめ~活字資料の有効活用~(3)

2016–03–26 (Sat)
 前回の続き。

 裁断が終わったらドキュメントスキャナに読み込ませます。数十枚の書類の束を超高速で読み込む事に特化したもので、これも様々な機種が出回っていますが、書籍の電子化に使うためには紙が二重以上に重なって送られた時に自動検知して停止する機能が絶対に必要です。対象冊数が少ないならまだしも、百冊単位以上となるとこの機能がない機種ではほぼ使い物になりません。

 裁断で切り離しができていなかったり、湿気や静電気などで一部の紙が離れずに重なったまま送られる事は普通にあります。これがないと事前に紙の枚数を数えた上で処理後のデータ件数と合わなければ、紙とデータを突き合わせて重送した部分を探さなければなりません。後処理に大変な手間と時間が掛かるため、自動検知の機能が必要な訳です。

 私は富士通のScanSnap iX500という機種を使っています。これは上記の紙の重送検知機能のほか、傾きの自動補正、原稿の色やサイズの自動判別機能などがあります。連続で読み込めるのは最大A4サイズまで、他に縦A5×横863mmまでの長い紙も一枚単位で読み込めるので、単行本の表紙カバーや帯を一度に読む事が可能です。専用シートに折り曲げて入れ、自動連結する事でA3の片面読み込みもできますが、これはあまり精度が良くありません。

 作業は本体を開いて上のトレイに最後のページを手前に、逆さにセットして本体のボタンを押すと一枚ずつ自動的に、両面を同時に読み込みます。雑誌であれば40枚(80p)程度まで一度に読み込めますが、紙質や保管状況によって読み込める枚数は変わります。読み込み設定は解像度300dpiのノーマルで充分(それでも後述するようにファイルサイズはかなり大きくなります)、色はカラーとモノクロの自動判別機能がありますが、どうも性能が芳しくないのでカラー固定で行います。なお処理途中で設定を変える事はできません。



 読み込みの後、残りのページがあれば再びセットして本体のボタンを押せば続けて読み込みます。紙が重送した場合は自動検知で止まり、PC側に最後に読み込んだページの縮小イメージを表示してくれるので、以降のページを揃えて再度セットします。B5,150p程度の雑誌であればトラブルが無ければだいたい1冊当たり5分程度で読み込みます。最後にPC側で終了のボタンを押すと紙のサイズの判別とPDF化まで自動で行ってくれます。

 後は出来上がったPDFファイルをざっと見てページの入れ間違いや大きなノイズが無いか、紙送り出口の詰まりによる読み込み不良がないかを見て問題無ければ、ファイルの開き方や綴じ方を付属のPDF作成ソフトで設定して済みます。一枚単位での不良であればそのページだけ読み直して入れ替えれば良いのですが、例えば読み込ませる紙の前後を間違えて多くのページを逆順に生成したような場合は、作成ソフト上で入れ替えるよりも最初から一冊丸ごと読み直す方が結果的に早く作業が済みます。


PDF編集ソフトでの確認(Adobe Acrobat XI)




 記事のその1でも述べましたが、ドキュメントスキャナで処理する場合、作成されたPDFデータの認識面に縦線状のノイズが乗る場合があります。酷いとページ全体を覆うように何本も入る事もあります。


縦線ノイズの実例

 これはドキュメントスキャナの構造上の弱点で、フラットベッドはガラス面上に置いた原稿を読取装置が移動して読み取るため、ガラス面に付いた微細なゴミやチリ等はそのままの形で読み取られます(全くわからない)。それに対し、ドキャメントは原稿を移動させて読み取りを行うため、ガラス面に引っ掛かった微細ゴミが線状のノイズとして読み取られてしまう事に依るものです。本の解体時に裁断を行う関係でどうしてもその種の微細ゴミは混入し易くなりますし、発生の度合いやどこで混入するかの予測も不可能です。対策は読み取る前に紙を裁断面を下にしてよく払う事と、スキャナ内部の頻繁な清掃しかありません。


フラットベッド(上)とドキュメントスキャナ(下)の
読み取りの基本構造とノイズの付き方の違い

 そのため、このスキャナは内部清掃が容易に行えるようになっています。私はB5であれば大体半年分(6冊)、A4ならば4ヶ月分(4冊)で清掃するようにしています。内部を開くと黒い筐体の表面一杯に微細ゴミが引っ掛かっているので、無水エタノールを染み込ませたキムワイプで拭き取ります。このとき紙送りローラーや読み取りのガラス面の汚れも拭いておきます。ゴミが多い時は隙間ノズルを付けた掃除機を直接内部に突っ込んで吸い上げる事もできますが、その際はノズル先端がガラス面に当たって傷をつけないよう上側のみを吸うようにします。


ScanSnap iX500の内部
赤矢印が両面読み取りのガラス面です。


無水エタノールはAmazon等で販売しています。
揮発性の極めて高い液体でボトルから直接出すのは非効率なので
画像右のハンドラップという微量を小出しにできる容器に分けて使います。

 まあ、私も最初のうちは気になって綺麗なスキャンを取り直して差し替えるという事もやっていましたが、100冊過ぎたあたりからどうでもよくなりました(笑)。今は画面全体に何本も太く入るほど酷い縦ノイズでも無ければ読み直し差し替えはしません。

 読み取り後に作られるPDFファイルは、解像度300dpiカラー読み込み設定でB5ならば1p当たり約1~1.1MB、A4ならば1.3~1.4MB前後が目安になるようです。当然出来上がるファイルも1冊150~200MBクラスになり、個人がPCで読む分には恐らく今の機械であれば支障はないと思いますが、クラウドサービスへの保存やスマホ等で読む場合はサイズの圧縮が必要かもしれません。

以下次回。

« 蔵書の電子化のすすめ~活字資料の有効活用~(2) | HOME |  蔵書の電子化のすすめ~活字資料の有効活用~(4) »

コメント

コメントの投稿

 
管理者にだけ表示

トラックバック

トラックバックURL

http://momo120.blog69.fc2.com/tb.php/824-a3f43ca5

⇒ この記事に対してトラックバックを送信する(FC2ブログユーザー)

 | HOME | 

プロフィール

MOMOKO.120%

Author:MOMOKO.120%
職業:自営業見習い
趣味:ブログの通り
模型の守備範囲:船
Webページ:模型の缶詰

現在は1/100初代海王丸の製作を一時休止して、ハセガワ1/350空母隼鷹を製作しています。

Twitter

カテゴリー

最近の記事

最近のコメント

カレンダー(月別)

06 ≪│2017/07│≫ 08
- - - - - - 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 - - - - -

月別アーカイブ

2017年 07月 【3件】
2017年 06月 【3件】
2017年 05月 【4件】
2017年 04月 【4件】
2017年 03月 【2件】
2017年 02月 【3件】
2017年 01月 【3件】
2016年 12月 【5件】
2016年 11月 【5件】
2016年 10月 【4件】
2016年 09月 【6件】
2016年 08月 【4件】
2016年 07月 【4件】
2016年 06月 【3件】
2016年 05月 【4件】
2016年 04月 【2件】
2016年 03月 【7件】
2016年 02月 【4件】
2016年 01月 【3件】
2015年 12月 【4件】
2015年 11月 【2件】
2015年 10月 【3件】
2015年 09月 【3件】
2015年 08月 【6件】
2015年 07月 【4件】
2015年 06月 【5件】
2015年 05月 【6件】
2015年 04月 【5件】
2015年 03月 【5件】
2015年 02月 【4件】
2015年 01月 【6件】
2014年 12月 【5件】
2014年 11月 【5件】
2014年 10月 【4件】
2014年 09月 【4件】
2014年 08月 【5件】
2014年 07月 【1件】
2014年 06月 【1件】
2014年 05月 【3件】
2014年 03月 【1件】
2014年 02月 【1件】
2014年 01月 【2件】
2013年 12月 【1件】
2013年 11月 【1件】
2013年 10月 【2件】
2013年 09月 【2件】
2013年 08月 【2件】
2013年 07月 【1件】
2013年 05月 【1件】
2013年 04月 【1件】
2013年 03月 【1件】
2013年 02月 【3件】
2013年 01月 【4件】
2012年 12月 【4件】
2012年 11月 【6件】
2012年 10月 【2件】
2012年 09月 【2件】
2012年 08月 【2件】
2012年 07月 【2件】
2012年 06月 【3件】
2012年 05月 【4件】
2012年 04月 【1件】
2012年 03月 【2件】
2012年 02月 【4件】
2012年 01月 【9件】
2011年 12月 【8件】
2011年 11月 【6件】
2011年 10月 【14件】
2011年 09月 【8件】
2011年 08月 【5件】
2011年 07月 【6件】
2011年 06月 【4件】
2011年 05月 【4件】
2011年 04月 【4件】
2011年 03月 【1件】
2011年 02月 【3件】
2011年 01月 【3件】
2010年 12月 【7件】
2010年 11月 【9件】
2010年 10月 【9件】
2010年 09月 【10件】
2010年 08月 【11件】
2010年 07月 【6件】
2010年 06月 【4件】
2010年 05月 【5件】
2010年 04月 【5件】
2010年 03月 【3件】
2010年 01月 【3件】
2009年 12月 【7件】
2009年 11月 【4件】
2009年 10月 【1件】
2009年 09月 【5件】
2009年 08月 【10件】
2009年 07月 【3件】
2009年 06月 【5件】
2009年 05月 【9件】
2009年 04月 【2件】
2009年 03月 【9件】
2009年 02月 【7件】
2009年 01月 【9件】
2008年 12月 【7件】
2008年 11月 【9件】
2008年 10月 【4件】
2008年 09月 【9件】
2008年 08月 【9件】
2008年 07月 【11件】
2008年 06月 【10件】
2008年 05月 【11件】
2008年 04月 【10件】
2008年 03月 【10件】
2008年 02月 【14件】
2008年 01月 【15件】
2007年 12月 【16件】
2007年 11月 【15件】
2007年 10月 【15件】
2007年 09月 【15件】
2007年 08月 【16件】
2007年 07月 【15件】
2007年 06月 【15件】
2007年 05月 【17件】
2007年 04月 【15件】
2007年 03月 【15件】
2007年 02月 【14件】
2007年 01月 【16件】
2006年 12月 【16件】
2006年 11月 【15件】
2006年 10月 【16件】
2006年 09月 【15件】
2006年 08月 【15件】
2006年 07月 【17件】
2006年 06月 【13件】

ブログ内検索

リンク

RSSフィード

ブログランキング

気に入っていただけましたら
押して頂けると励みになります

AD banner

楽天で探す
楽天市場