1.如何扫描表格
所需工具:扫描仪;word2007 、Excel2007 ;尚书七号OCR 软件。
1. 扫描表格。首先依次把表格扫描成TIF 图像文件备用。扫描时300dpi 就可以,太高的话识别率反而下降,而且处理时间加长。文件名最好与页数相关,这样在查对起来时也更加方便。在预扫时确定扫描的边界,没有用的部分不用扫描,只选择表格体就可以了。
2. 进行表格识别。现在轮到本次任务的主角尚书七号OCR 识别软件登场了!我个人认为它的表格识别能力还是很强的。一般在买扫描仪时附送,没有的话可以到网上下载一个。在尚书七号软件中,点“ 文件→ 打开图像” ,找到刚才扫描的表格图像。
这时在右侧图像区中单击左键,选“ 编辑→ 旋转图像→ 右转90 度” 或按“ Ctrl+R ” 组合键,将图像摆正(这一步根据实际情况进行左旋还是右旋)。
现在图像已摆正了,不过还有一些倾斜。这时点“ 编辑→ 自动倾斜校正” 或“ Ctrl+D ” 组合键对原稿进行倾斜校正。这一步骤非常重要,直接影响到表格识别率。下面进行表格的识别。点“ 识别→ 开始识别” (图1 ),或按快捷键“ F8 ” ,几秒种后识别结果已跃然屏幕上。
图1 尚书七号软件
下面对识别后的表格文字进行初步校正。一般怀疑有误的地方,软件用红色表示出来。当鼠标放上去时会有图像提示,方便进行校正。在删改后表格线可能有所变动,不用管它。对于0 ~9 的识别错误,有的必须先行加以纠正,例如“ 3 ” 识别成“ :{ ” ,“ 7 ” 识别成“ / ” ;有的可以在Word 中用查找替换的方法加以改正,比如,“ 0 ” 识别成字母“ O ” ,“ 1 ” 识别成字母“ l ” ,“ 5 ” 识别成字母“ s ” 。这样,80% 的错误可以在这里消灭。数字间有空格也不用管它,可以进行后期处理(图2 )。
图2 尚书七号软件
3. 在 Word 中进行纠错并生成Excel 数据源。将在尚书七号中识别出来的表格和文字复制、粘贴到Word2007中(2000 及以上版本即可)。页面不妨设置为横向A3 纸,因为我们只是利用Word 进行纠错并生成TXT 文件,这样粘贴过来的表格才不致于折行。表头部分不需要粘贴。这时候再把非常明显的错误手动纠正(别忘了时时存盘)。
每张表格识别后都做以上处理,待所有表格都粘贴过来以后,利用Word 的查找、替换功能进行纠错。具体操作如下:选择制表符“ ┣ ” ,按“ Ctrl+C ” 组合键;点“ 编辑→ 替换” ,在“ 查找内容” 文本框内按“ Ctrl+V ” 组合键,“ 替换为” 文本框内不填任何字符,点“ 全部替换” ,就消掉了所有的“ ┣ ” 符号。
类似地,我们将“ ━ ” 、“ ╋ ” 、“ ┫ ” 都消掉。这样做的目的就是将每行之间产生的表格线去掉。下面再用此功能,将“ .” 及“ 。” 替换成小数点“ . ” ,将字母“ O ” 、“ l ” 、“ s ” 分别替换成数字“ 0 ” 、“ 1 ” 、“ 5 ” ,再有把所有的空格也用这种方法去掉。“ ┃ ” 可以保留,也可以替换成英文的“ , ” 作为间隔符。这样,表格就变成了下面的样子:
接着把这个文件另存为纯文本文件。
4. 数据导入Excel 。打开Excel 软件,点“ 数据→ 导入外部数据→ 导入数据” ,“ 文件类型” 选“ 文本文件” ,找到刚才保存的那个纯文本文件,点“ 打开” 进入文本导入向导(图3 )。
图3 文本导入向导
步骤1 中默认的“ 原始数据类型” 就是“ 分隔符号” ,直接点“ 下一步(N )” 。
在步骤2 中,“ 分隔符号” 文本框中单击左键,输入英文符号“ , ” ,点“ 下一步(N )” 。
步骤3 中,在“ 不导入此列” 前收音机钮上点左键,忽略最前面一列。点“ 完成” 。
再单击“ 确定” 。这样,数据就被导入到Excel 中来啦!
下面,再对导入到Excel 中的数据进行校验、纠错。这一步骤比较好做,因为在Excel2007中数字是右对齐的,如果在前面的步骤中有的数据错误没有被纠正,则会被认为是文本数据,左对齐。这样就可以轻松地将它们挑出来进行纠正(图4 )。
图4
因为现在级别不够,无法上传图片,不好意思
2.如何将扫描表格如何转换成excel表格
ABBYY finereader v9是我见过的最强大的PDF(图片格式或者是扫描件)转excel的软件。它是一款OCR软件,界面比较简洁明,9.0和以上版本有简体中文版的,支持100语言的识别,特别是混合多种语言识别效果也非常好。
国内的OCR软件仅仅是对中文的识别比较好而已。而且,这款软件只要你设置好识别文件所用的语言然后打开PDF文件(支持直接打开的)然后其他的工作就交给软件了,识别完后 文件------另存为excel格式就可以了。而且版面的保持能力是我见过的OCR软件里面最好的一个,识别率也是最高的一个,就是转换识别的速度比较慢。只要PDF文件比较清晰,准确率基本可以达到95%以上(除了数学公式、计算式、化学式、分子式、三角函数等专业的内容之外),强力推荐大家使用。
3.如何将扫描的表格变成Excel格式文件
1、首先我们需要打开需要编辑的csv文件
2、点击上方文件按钮
3、点击另存为,这里保存在桌面所以点击桌面
4、弹出对话框,在保存类型里面选择excel工作簿
5、点击保存,这一点很重要。
6、就可以将扫描的表格变成Excel格式文件了。
-
日照好玩的地方和吃海鲜应该去哪听说日
日照好玩的地方:万平口:"旅游来日照,必到万平口",已成为各地游客的共识。刘家湾赶海园:以赶海系列活动为主,集旅游、休闲、度假、民俗、健身于一体的综合旅游园。竹洞天:位于山东省日照市城区西端的将帅沟毛竹…
-
什么是铸造
铸造是指将室温中为液态,但不久后将要固态化的物质倒入特定形状的铸模待其凝固成形的加工方式。 被铸物质多半原为固态但加热至液态的金属(例:铜、铁、铝、锡、铅等),而铸模的材料可以是沙、金属甚至陶瓷。 因应…
-
变形金刚中博派和狂派各有哪些人物
博派:擎天柱,铁皮,大黄蜂,爵士,棘齿。狂派:威震天,红蜘蛛,眩晕,吵闹,萨克,碎骨魔,路障,迷乱。…
-
一平方毫米的铜线能过多少安的电流
1平方毫米的铜线在不同电流下通过的安培数不同。最大是18A:(1)60A以下,选1平方毫米的铜线安全载流量是6A;(2)60~100A,选1平方毫米的铜线,安全载流量是5A;(3)100A以上,选1平方毫米的铜线,安全载流量是2.5A 。…
-
中华人民共和国城乡规划法第四十条有规
自2008年1月1日起施行的《中华人民共和国城乡规划法》第四十条:在城市、镇规划区内进行建筑物、构筑物、道路、管线和其他工程建设的,建设单位或者个人应当向城市、县人民政府城乡规划主管部门或者省、自治区、直辖…