跳到主内容

自制书本扫描仪

使用 camscanner (update 2018)

  • 强烈推荐 camscanner (扫描全能王), 一个国产手机软件, 直接拍照, 自动切图, 优化效果, 非常好.
  • 我已经用了好多年.

diy 书籍扫描仪

扫描仪效果不错,但是弄一个放在家里, 还是太占地方了. 另外扫描的尺寸也有限制. 所以上个长周末自己DIY了一个扫描仪. 主要是使用PVC管子搭一个架子, 再利用自己的照相机来拍照.

架子

需要一个三脚架或者其他架子把相机架起来, 方便拍摄. 当然最好是垂直向上/下喽. Instructables上有很多教程. 我选择的是相对简单的那种: 利用PVC管子即可. 直接奔到bunnings购买一根40mmPVC管子, 足够结实, 10澳刀不到. 可是接头就另外花了20块钱. 借了锯子直接就在那儿割好. 另外需要一个1/4"的螺丝来挂相机, bunnging也可以搞定, 但是得回家才能用电钻在盖子上打洞.

成品如下(请忽略杂乱的背景): 用笔记本通过usb来控制相机.

这样的PVC架子不是很稳定, 如果手碰到相机, 它会抖动. 下次有机会改成两个三角形支撑会比较好.

另外书如果比较厚, 打开会不平, 我用一块玻璃压住了, 可是玻璃太小, 力度不够, 如果用手指, 会被拍到镜头中.

旁边的两盏灯亮度不一, 真是伤脑筋.

自动拍摄

幸好不用手工按. 因为我有强大的gphoto2. 它可以从命令行操纵相机, 例如读取存储卡上照片, 删除照片, 拍照等. 现在我需要的是类似Time lapse的功能, 就是每隔10秒钟拍照一次, 中间我可以翻页..

一开始相机使用了canonS30, 可是老是无法调整镜头长度, 很多设置都无法保存, 例如闪光灯要每次都关掉. 一气之下只好祭出500D来, 果然轻松搞定.

gphoto2 --set-config /main/imgsettings/imageformat=3
        --set-config /main/capturesettings/picturestyle=5
        -F 20 -I 10
        --capture-image-and-download

第一行是保存在内存中, 不要写到存储卡上. 第二行是表示拍成中等大小照片(后来看还是嫌大了). 第三行是连拍20张, 两张之间间隔10秒钟. 第四行是拍摄照片并传回电脑.

当然可以用ctrl+c中断拍摄.

处理/合并

照片传到电脑上后, 一切就简单了. 因为我有伟大的imagemagick. imagemagick提供了一系列的工具, 最常用的应该是convert. 嗯, imagemagick太强大又太复杂了, 有兴趣的人可以自行去研究一下. 这儿的好心人Fred提供了很多基于 imagemagick的脚本. 其中一个textcleaner可以用来对扫描的照片增强处理一番.

textcleaner  -s 1 -e stretch -f 10 -o 5 -S 200 input.jpg output.jpg

效果:

比较(理光的一个扫描仪,自动生成pdf, 无增强):

最后有了一大批照片, 只要

convert *.jpg output.pdf

就行了.

其他想法

: 编号 在笔记本的每一页上盖一个章, 里面有aaabbb数字, aaa是对应每个笔记本的, bbb是对应每个页面的.

这样方便OCR来扫描, 加标签/改名字. 以后如果笔记内容更新了, 也可以很方便替换老的内容.