www.x630book.com,
“汇聚全世界的资源,分享你我他的快乐……”
听着郑秋缓缓读出这条产品介绍,俞华忍不住砸吧砸吧嘴。
“嗯!听着的确像是某种资源分享平台?”
郑秋登时无语,翻着白眼指了指下面的一行小字。
“这么牛逼的公司怎么可能这么肤浅!看下面!
精选优质知识资源、促进教育方法改革、提升人才质量、推动智慧分享。
弘扬中华文化,吸收世界文明。
加快脚步迈入知识型社会——广大莘莘学子的福音!
这格局……一听就大的没边了!”
“某个相亲网站还喊口号说自己想促进人类繁衍,延续地球文明呢,大的没边谁不会啊?”
“嗯……相亲网站?”
郑秋狐疑的盯着面前的大龄光棍。
“咳!这都是小细节,那什么,我们快点进去看看有没有什么惊喜吧,这可是白夜纪出品!
唔……上面写着可以用天枢ERP或者八戒的账号进行同步完成注册,咱们都没有。
如果是新用户,那么个人账号注册则需要实名认证,等会儿……”
于是,注册……输入身份证号……绑定手机号……
一番操作之后,俞华获得了一个初始账号。
登陆之后,眼前立刻切换到了一个看着十分简洁的新界面。
左边是个信息栏,除了自己的个人姓名和待编辑资料外,还有一个叫做“智慧币”的东西,目前数额为5。
右边则是光秃秃的什么都没有,就一个孤零零的搜索框,背景则是白夜纪的机器人logo。
“这东西怎么用?”
“既然是知识类的分享平台,那应该是类似搜索引擎的东西,先输入一个搜索项目试试看。”
于是俞华随手输入“人工神经网络(ANN)随机森林算法相关期刊论文”……
这也正是他目前的研究课题。
“刷!”只见界面一变。
10篇相关论文及其简介就一项项出现在两人面前。
“咦?还不错诶,上面头几篇都是这个领域引用次数较多,权重较高的权威论文……
看!第10篇还是你去年的论文!”俞华惊喜道。
郑秋抢过鼠标,点开自己那篇论文,果然,是自己写的没错,上面清楚的标注了著作人和发表时间。
看着自己的作品,郑秋有些臭屁的点点头。
“嗯!看来这个检索还是有些眼光的嘛!”
俞华懒得搭理这个自恋狂,又点击下一页,继续查看检索顺序10~20的其他论文,果然又发现了好几篇熟悉的业内权威。
一直到第100篇,几乎没有一篇是无效的“水文”。
就这检索效率和效果,就绝不比蜘网来的差了。
而且令人惊讶的是,别的网站通过期刊论文检索出来的,只要年份稍微久远点,一般都是图文版,也就是用相机扫描下来的。
因为以前电脑普及度不高,论文大多还只是进行纸质存档的。
就算后来电脑普及了,一篇篇重新机打出来也是一项异常庞大浩瀚的工程,所以只能扫描电子化进行存档。
只不过,那清晰度就像是在对着电脑看旧报纸,很影响阅读体验。
比如有一篇《随机向量学习模型》,他明明记得,在蜘网的检索数据库中它还是一篇扫描文档。
然而这里显示出来的,却是清晰完整的电子档。
就连文章中的表格和图文,也进行了高度还原原著的电子化重制,让人一目了然。
就算是原作者看了,怕是也只能说一句“无懈可击”……
“这帮家伙,该不是把旧的数据库文献全都给优化了一遍吧……”
郑秋脑子里突然蹦出一个极为不可思议的想法。
这种工程量,绝非少量人力可以完成,唯一的可能就是依靠自动化程序进行批量图文转换识别……
如果真是如此,那这图文转换效果简直炸裂啊!
“这东西说是还能查重来着,不知道效果怎么样……我试试看。”
俞华没忘记自己原本的目的,当即从电脑里找出一篇已经审核过的硕士生论文,按照提示直接拖入对话框……
【请问是否花费1智慧币进行查重服务?是/否】
“原来要花站内币啊……1币一次,这样看来每个新用户都有5次免费查重机会?还不错。”
俞华心里还是有些满意的。
虽说不是完全免费,总比那些个上来就直接弹付款码的要好些。
选择“是”,下一刻,画面上蹦出一个进度条。
大概3分钟的功夫,进度条就缓缓拉到底,最终跳出来一个大号数字——重复率69.3%!
“啥?69.3%?”俞华脸上有些错愕。
“怎么啦?”
“这篇论文我用蜘网查重过,最后结果是36.2%来着……喏,这是蜘网的查重报告单。”
俞华从旁边的书桌上找了找,递过去一张打印A4纸。
当蜘网查重系统在检测论文内容时,会将论文与自己的系统库进行比对。
如果发现连续出现13个字符,也就是七八个汉字类似,就会判为重复,计算这部分重复率,最后将查重后的数据显示在最后的报告单中。
同时还会在文本中以红色字体显示重复内容,并在重复区域旁标注出该段引用的相关文献。
总的来说,蜘网虽然收费贵,但是就检索结果来说,服务还是比较到位的。
郑秋看着手中的查重报告单,又看了看电脑上给出的69.3%的高重复率,皱了皱眉。
“别的不说,就这查重速度,就快的有些匪夷所思了,该不是互联网算命……玩随机那一套乱给的吧?”
刚刚那进度条,满打满算也不超过3分钟。
3分钟,看似有些漫长,但相对规模庞大的文献数据库检索量来说,简直快到不可思议!
要知道,蜘网的单次查重耗时一般为30~60分钟,在毕业高峰期间甚至会超过2个小时。
相比之下,这样的“查重”耗时,多少显得有些儿戏了。
什么样的运算速度和检索算法,能在这么短的时间内检索完那么庞大的文献库?
“不可能吧……这么优秀的公司,而且人家也给了查重结果的。”
俞华说着点开下方的“查重报告”按钮。
下一刻,电脑前的两人都愣住了。
画面上,这篇论文超过一半的地方都被红色标注了出来,旁边挂了引用文献和对应跳转链接。
密密麻麻的根本不像是胡编乱造……
“真的假的啊?”郑秋有些傻眼。
他一把拿起那份蜘网的查重报告,开始逐行比对。
“这个有,这个也有……嘶~全中!”
蜘网检索出来的重复段落标注和引用文献,这里全都有,而且还贴心的给了文献链接,真假一目了然。
那么多出来的这些……
通过两人比对,得出了一个令人震惊的结论。
那就是这个智慧树所检索的数据库……居然比蜘网来的还要全面!
通常来说,论文查重系统的数据库,主要包括“学术期刊数据库”、“学位论文数据库”以及“互联网数据库”。
这其中“互联网数据库”最为复杂,指的是大量的网页、博客、论坛等互联网信息资源。
论文查重系统会将互联网数据库作为重要的对照,检测论文中是否存在互联网上已被公开发布的相似内容。
“卧槽!对方哪儿来的这么庞大的数据库资源?”俞华不解道。
下一刻他似乎是反应过来……
“该不会,是爬虫程序吧?”
国外有个牛逼的程序猿,靠着编写的强大爬虫程序,抓取了世界上超过6亿个网站的网络公共资源!
最后就连骨歌、亚马孙、Adobe、ebay等互联网大厂,都前来寻求数据支持。
一桌一椅一电脑。
单枪匹马搞出了年营收1400万美元的夸张战绩!
而整个公司仅有一个员工,堪称有史以来商业效率最高的企业!
所以……会爬数据,也是绝对的高科技!
“不止!你看,就连图表或者公式的抄袭……对方也能检测出来!”
郑秋指着一串字符旁的标注震惊道。
蜘网的检测技术是有缺陷的,部分“图表”,“mathtype编辑公式”,“word代码”都不能识别,这就留下了一些漏洞。
而现在……这个漏洞被堵上了……