0018 自由才是翻译的精髓
等周磊去倒了杯水回来后,软件里显示:“现在的同声翻译软件一点也不好用,你问它干什么?”
周磊原原本本的把张杰遇到的问题,告诉了黑客大佬。
大佬回了一串省略号,十分钟后,他通过软件传过来一个软件包。
周磊接收后,解压后安装,执行exe文件的时候,提示缺少语音库。
“嘿,大佬,你的软件不全啊,还少语音库。”
“懂个啥啊,加上语音库你电脑都装不下,你以为语音库就是现成的?自己去弄。软件目录下面有一个生成工具,你看里面的文档,自己去建语音库。这个软件不是那种傻兮兮的,切换到什么语言就只能识别什么语言的。”
“就是说我可以把很多种语言的语音库都放在一起,软件也可以自动识别出来。”
“就是这个意思,不然那些说话带英文单词的人会不会很难受。”黑客大佬回了话后,就不再搭理周磊了。
周磊把生成语音库的工具单独的复制出来,怎么样才能把各种语言的语音库都收集到,这个可是一个巨大的工程啊。
还是先做常用的中文语音库吧,去问两家翻译软件公司买,估计人家都不愿搭理你。
周磊还是用Python吧,找一些视频网站,让软件在后台开着,前面一直在放视频吧,这样只要有足够多的时间,就可以生成一个识别率至少四个九的语音库。不过大夏国数不清的方言,就只能慢慢来了。
这活可不能在自己笔记本上跑,跑起来可能需要几个月的时间。
周磊给集成商打了个电话,叫他们送了十台低端的PC服务器过来,国产的就可以了。然后在机房又租了几个标准机柜,让集成商安装好。
几天后,周磊把工具软件和自己写的脚本都放了上去,让服务器开始跑起来。
假如那天维护人员打开这些服务器连接的KVM,就会发现屏幕上一直在播放着各种语言的视频,有电视剧、纪录片、新闻等等,只要薯片站上有的,它就会随机播放。
语音库以一个肉眼可见的速度在缓慢变大,从0KB慢慢的增长为一个超过300GB的巨大文件,这个还不止一个,是十个300GB文件。
周磊估计到最后进行消重合并的时候,至少也会有1个多T的大小。
语音库文件的增长速度变慢,一天都不能增加100MB,周磊觉得差不多了。他远程把十个语音库复制到了一个目录下,现在的服务器上的硬盘都插的多,而且还大,所以没有什么问题。
打开了工具软件,把导入的目录指向到了那个目录里,软件立刻就发现了所有的语音库文件包,并且显示出合并后的文件大小。
周磊觉得自己小看了语音包的大小,合并后还有1.5TB,这个太大了。
忽然他发现还有一个按钮显示着“分割”,尝试着点了一下。发现这个功能非常的好,可以把语音包分割成基础包和网络包,或者是按照语种划分,但那就没有必要了。
按照语种划分,就没有翻译的用处,只有语音转文字了,但是这个用于语音输入法还是不错的,但周磊暂时没有想要进这个不赚钱的行业里。更何况“某飞”做的还算可以,只是有时候输入法会犯傻,自己完全没必要进这个红海市场。
周磊选择了基础包和网络包,这样软件可以直接读取一些常用单词的语音库,如果找不到对应的数据,就会上服务器进行查询。
这不就又是一门生意吗?这个生意自己就能做,这样就不用让办公室里一群人天天无聊的要死。
周磊把基础包复制到自己电脑上,然后打开了同声翻译软件,念了几句差不多非常简单的中文对话句子,软件就迅速的翻译成了英语,这个是默认的选项。
在经过测试几个科技文献后,周磊发现了一个问题,能够正常的识别中英文的语音,但是对于翻译的质量差的太远了。英语翻译成中文没有问题,中文翻译成英文就好像几年前的机翻或者中式英语。估计是自己让软件一直在国内网站上学习的原因,但是国外很多网站是不存在的。
那可怎么办?
有钱就有办法,周磊挑选了一下,找了亚马逊的云服务器服务,一口气下了二十台的整机的单子,租了一年,现在一点也不差钱,还要了无限流量。
同样的他把工具软件和修改后的脚本往上面一扔,就等着十天半个月后的收割。
一个月后……
“各位同事,今天开这个会的原因是,我又开发了一个新的产品。”
嗯,没有会议室,大家就是坐在自己的位置上,听周磊站在白板前在说话,白板就直接的挂在墙上。
经过了机器狗的信息轰炸后,大家都觉得老板是个天才,只是有时候不着调而已。
大家意思一下的鼓了下掌,“老板,快说说是什么产品?”
周磊在白板上写了两个巨大的字“翻译”,“很久以前,就有很多公司说要革掉翻译的饭碗,让学生不用再学习英语,但是实际上都是在吹牛。”
“周总,您准备革掉谁的饭碗?”
“问的很好,我不准备革掉那些苦哈哈的同声翻译们的命,我们不做这个市场,如果有人打电话来问,就说我们没有这项服务。当然了以前客户自带软件去参加会议,那就不是我们可以控制的了。我们只是不提供会议同声翻译服务。”
“那么?”
“商务用途和个人用途,都是属于短暂性的,及时性的需求。可能他需要的就是几分钟的翻译工作,他不可能找到一个随时待命的同声翻译,也可能已经对那几家翻译软件公司已经很失望了。”
“对啊,我之前出国旅行,出了点事情,意外受了伤,连医院我都费了很大的劲才找到。按照我这英语水平,能找到吃饭睡觉的地方就好了。”
“没错,你就是我们的服务人群。”
“可是老板,‘某飞’不是出了很多代的随身翻译盒子吗?”
“如果你用过你就知道它只是一个简简单单的翻译工具,不能保证在任何时候都可以准确识别别人的语种和口音。当你不知道对方说的是什么语言的时候,翻译盒子是没有办法准确翻译的。”
“这么说,您的软件可以识别小语种和乱七八糟的口音了?”
“是的,U盘这这里,你们装好后,有一个月的试用期,随便你们找什么语言来试,保证你们满意。”
在员工们进行疯狂测试的时候,周磊决定尝试着研究软件的源代码,把翻译工具软件装进一个三石科技出品的翻译盒子里,一体机的设计才来钱啊。
把一个Windows的软件,转化成嵌入式系统上的软件,这个难度绝对让人退避三舍。
周磊在研究了几天后,就放弃了,最后还是找黑客大佬出了一份新版的软件,包括了翻译盒子上基于嵌入式操作系统的,还有安卓和IOS版本的。甚至连翻译盒子的电路图都弄出来了,只要找家电子厂就可以代工生产。
鸡贼的周磊还是用了那招,翻译盒子上只有Boot引导程序,只有上线激活后,才会更新完整的程序和基础语言包。
周磊叫张杰介绍了他的一个朋友,一家小电子厂,都快没业务要倒闭的样子。只给他每台三十块的代工费,所有的电子元器件都按照大宗采购的价格算。这样就算电子厂拼命的省钱,估计能赚到手的不会超过35块钱。
不能说周磊很坏,这个只是生意。就算压倒25块一台的代工费,照样有人抢着做。很早以前FoxCon也是如此,4美元一台的手机代工费,也差不多不到30块钱。
先打样生产了两百台,周磊测试了盒子的激活,软件的推送,一切都没有问题。
安卓和IOS版本的软件已经提交审核,这样新产品又可以拿出来卖了。
周磊这次可以自己建服务器机群了,他弄几个机柜的PC服务器先用来翻译软件的远程支持。还有几台单独是用来软件更新用的。
因为是软件产品,所以周磊决定还是先放开下载,免费试用一个月,要绑定手机号。免得有些鸡贼的家伙,到时候不舍得花钱买月卡。不充钱怎么可能会变强。
等一切就绪后,他在微博和公告号上发了条信息。
两个事情,一个是纯软件版的同声翻译软件上线,欢迎大家下载测试。第二个是征召100名同声翻译盒子的测试员。
现在三石科技的微博和公共号上差不多有两百多万人,所以他这么一发,后台看反馈的员工就吃不消了。大片大片的刷屏,根本看不过来。
周磊只能继续发信息,“只要大家在两个软件上留言,就有机会抽取。我们会用微博和微信抽奖的方式抽取测试员,时间定在明天中午十二点。”
这下总算好一点了,大家不用激动,这个是拼人品的时候了。