展开
1、音频转文字:目前市面上的音频转文字大多收费。音频转文字的需求是:上传一段音频,直接识别成文字,对于会议记录的比较好使,注意不是实时的语音识别。
2、文字转语音:转的语音不要太生硬。
3、截图文字识别(OCR):截屏完成即可弹出截图所含图片中的文字。
4、批量图片文字识别:选择多张图片,直接识别出每张图片的文字。
5、复制翻译:看英文文献,有时候懒,如果能有置顶悬浮窗,实时监测剪切板,遇到想要翻译的段落,直接复制,即可给出多国语言翻译结果也是刚需;当然有些论文文本不能复制,所以还复用了截图OCR的功能,对OCR结果进行翻译。
6、图种制作:这个不入流,纯属个人爱好,没啥技术含量。
需求产生开发动力,基于百度AI和pyqt5制作了自己的小工具,解决了上述所有需求,需求也就就是功能了。
1、批量音频转文字
(1)比如批量识别小学生课文
(2)比如识别长达五分钟的《荷塘月色》
(3)识别岳云鹏的相声
2、文字转语音
这个没什么好说的,输入文字,选择发音人、语速、音调之类的,可试听,可生产mp3格式的音频文件。
3、截图OCR
点击截图按钮即可截图,自动弹出识别文字。如下动图演示,也是个初版,界面简陋。
4、图片批量识别
在截图OCR下拉按钮有个图片批量文字识别功能,这都属于OCR功能,简单粗暴,批量选择图片,即可识别所有图片中的文字。:
5、复制翻译
看英文文献,有时候懒,如果能有置顶悬浮窗,实时监测剪切板,遇到想要翻译的段落,直接复制,即可给出多国语言翻译结果也是刚需;当然有些论文文本不能复制,所以还复用了截图OCR的功能,对OCR结果进行翻译。6、图种制作
没啥意思,就是将一张图和一个压缩文件合并成一个图片文件,这个生成的图片文件打开是一张图,如果后缀修改为zip,解压后就能看到原先的压缩文件。
加载全部内容
格式转换工具绿色版4M30243人在玩kgma是一种酷狗音乐的专属文件格式,智...
下载基督教歌曲大全1218首mp3244.60M12563人在玩西方教会的素歌虔诚的教徒都知道教会歌曲~...
下载创新5.1声卡效果包4K11401人在玩语言五项你的最爱~那你一定需要创新51声...
下载vocaloid4官方版937M9805人在玩说道音乐制作软件就不能不提vocaloi...
下载Sports Sounds Pro7授权版722K7627人在玩想要一款工能强大的音控软件就试试Spor...
下载爱剪辑无水印完美版268M6851人在玩使用爱剪辑的朋友们想不想没有水印的打扰去...
下载SAM机架变声效果包完整版51M6392人在玩作为后期音效合成相关行业的朋友,您是不是...
下载3D环绕音乐制作软件28.10M6211人在玩3d音乐大家都有听过吧,3D环绕音乐制作...
下载Sports Sounds Pro 7中文版1M5791人在玩今天带来的SportsSoundsPro...
下载Vocaloid5汉化版1G5670人在玩很多做音频工作的应该需要Vocaloid...
下载