Datahub
数据改变生活

关于数学建模竞赛中的一些小建议|PART02

发表时间:2022-07-14 14:26


原创 张浩驰 求知联盟 2020-06-04 21:59
图片

本次推送约1200字 | 看完耗时约3分钟


图片

今天给大家介绍一款特别实用的文字提取和实时翻译软件



图片



不清楚大家在阅读一些英文文献的时候,是否觉得翻译是一个很头疼的问题。因为纵使英文再好,对于我们大家来说,还是非母语的语言,还是有偶尔一两句话不好吃透。但是我们也不想在翻译网站和论文之间来回切换,我们可能仅仅想翻译一小段话而已。
或者我们仅仅想从PDF中提取一些文字出来,方便我们直接使用。
对于参加一些英文类竞赛,如美赛、Kaggle、程序设计训练赛这些,我们可能需要对题目进行适当地翻译,以便我们对题目本身理解更加深刻。
这个时候,你可能会想如果有一款可以和QQ截图一样方便的翻译神器就好了!幸运的是,干的软件是存在的(注:目前只发现了PC的版本,用MAC的小伙伴也可以去顺藤摸瓜看看有无相类似的软件)
这款软件的名字叫做:天若OCR文字识别
下面重点介绍一下这款软件,它是一个小众软件,因此不是特别容易找到安装包,大家加群后可免费获得。
这款软件很小,把压缩包解压以后就可以使用,我们解压后得到的文件夹打开后,得到下面的内容:
图片
天若OCR文字识别文件夹中的内容

我们打开最下面的应用程序,就会在后台启动了,如果启动失败,可以尝试重新打开或者重启下电脑。

打开后的效果:

图片
天若OCR在后台中运行

有两种办法激活这个翻译系统,一种是按照上述的办法双击开始截图识别,一种是直接按F4,对于笔记本电脑来说可以同时按Fn+F4或者点亮Fn键后直接按F4。打开后是这样的:

图片
按F4后开始截图识别文字

识别后的效果见下:

图片
文字提取后的效果

非常迅速地把文字提取出来了,后面我们就可以按照菜单上面的功能这一小段话进行处理了。

其中对于我们来说比较实用的是翻译部分,我们按翻字即可开始翻译。翻译后的效果见下:

图片
中译英功能体现

虽然这样的翻译我们可能不能直接应用,但是足够我们大概看一看了,尤其是英翻中。

下面我们也可以找一个英文的文献过来试一试,比如之前让大家虚惊一场的陶哲轩的文章

图片

比如尝试用该软件提取并且翻译摘要部分:

图片
提取摘要部分

下面是翻译的结果:

图片
英译中功能体现

好吧,这里有点尴尬,把摘要翻译成了抽象,不过无伤大雅,后面的摘要部分翻译地简洁清晰。基本上中文使用者写摘要的程度也和这个差不多了。

我们同样也可以试一试带有数学符号的部分:

图片
提取的内容
图片
含有数学符号的英译中

从上面可以看出,虽然在符号识别这一块功能有待提高,但是结合原文一起阅读,基本上这个翻译程度还是够用了。

本质上这款软件的好处在于,我们可以时时刻刻地提取我们想要的文字,并且可以对这些文字做一定的处理,大大提高了工作效率。这对于我们科研工作或者参加比赛,都是一件可以提高生产力的利器!

图片




QQ:258506508                                     联系电话:020-000000    000-000000                                   联系邮箱:xxx@.co.m                                     联系地址:XXX省XXX市XXX县XXX路