0579-8699-3791

义乌网站建设 APP开发 要找 ➙ 专业的义乌网络公司

知识

开发者,是移动互联网生态中不可忽视的中坚力量,他们坚韧不拔且极具勇气,他们坚持正确的价值观,并坚信创新能够创造价值。AppSo也一样,我们希望那些具备可贵品质的开发者们,

您当前位置>主页 > 知识 > 软件开发 >

专访白描陶新乐:做高品质又便宜的扫描识别 App,是开发者的浪漫

发表时间:2020-06-15 15:09 文章来源:admin

开发者,是移动互联网生态中不可忽视的中坚力量,他们坚韧不拔且极具勇气,他们坚持正确的价值观,并坚信创新能够创造价值。AppSo 也一样,我们希望那些具备可贵品质的开发者们,和他们带着闪光点的产品,能够被更多人所看见。AppSo 每周都会邀请优秀的开发者,和他们聊聊在开发产品的过程中,那些有趣动人的故事。

在我们每个人都会遇到的难题中,其中就有一件是——图片转文字。将图片中的数据、文字导出加工,这在几年前可能会难倒很多人,要不是工具太贵,就是识别的结果质量太差。

但随着 App 市场的开拓,好用的识别翻译工具便诞生了,这其中就有陶新乐开发的《白描》。《白描》目前拥有 200 万用户,除了较高的准确率和不高的定价,它的校对及更多编辑功能,对学生党、文字工作者来说,都有很高的实用性。

独立开发者,之前在北京工作,就职于国企担任高级研发工程师,因为不想和女朋友异地,遂辞职成为独立开发者,目前的主要产品有白描、两个西柚、西江月、白描取字、晓时。

开发的时候是完全没想过的,最开始开发的时候就是为了给女朋友做个能识别纸质书上的文字用来记笔记的软件,做完了之后发布到 App Store 也是职业习惯,没想到发布之后会非常受欢迎,坚持下来获得了现在的用户规模。

满分 10 分打 8 分吧,扪心自问,白描无论流程的设计还是实际功能的实现,都在这个领域做到了自己的特色和稳定出彩,也才能获得众多用户和各平台的肯定,比如小米市场的金米奖、豌豆荚设计奖、OPPO 应用时刻以及 App Store 的首页推荐等。

当然,仍然有一些功能排在计划中继续完善,比如公式的识别、PC 端的开发以及对疑难图片的识别如何更准确等等。

白描是一款多平台通用的 OCR 识别与文件扫描工具,能高效完成文字识别、表格识别、长图识别、文件扫描、图片合成 PDF、色彩切换、批量处理、翻译等需求。

女朋友常做读书笔记,使用了当时市面上的文字识别软件觉得有的识别流程累赘,会员也太贵,免费的识别结果又不好,于是就想到自己能给她做个用得爽的 OCR 识别工具,并且很快付诸了行动。

主要挑战就是,自己从头完全做自己的识别引擎几乎是不可能的事,于是研究了市面上可以提供这个服务的厂商的产品并进行对比,尝试了各种图片各种情况,找出目前效果最好的那个。

场景蛮多的,比如上课拍 PPT 提取文字记笔记、把纸质合同扫描成电子版并且可以制作 PDF、把纸质表格转成 Excel 电子版、翻译图片上的文字、老师可以用来拍试题识别之后对试题再加工、律师用来提取纸质文书上的文字等。

在识别之后,白描的校对功能,能让识别结果与原图显示在同一个界面,用户还可以找到需要修改的地方,在此基础上进行编辑。

图像压缩,保证清晰度又尽量减小图片体积;波纹过滤,有些时候拍电脑屏幕会有一些干扰波纹,这些要优化掉;长图自动裁剪,检测到长图的空行位置自动裁剪开,不会裁到文字;去除杂乱背景,有些纸比较薄的情况会透出背面的字影响识别,用户可以切换色彩去掉那些干扰因素;自动分段,针对文章进行了自动分段,更易于阅读;自由选区识别,很多人有识别多样化排版的文字需求,比如报纸那种排版,东一块文字西一块文字,可以使用自由选区的功能,把需要识别的部分画出来,白描就会按照画的顺序去识别了。

主要是自动检测边界,因为在扫描的时候避免不了裁剪与矫正,我们尽量做的更自动化,当然检测边界的准确度还有很大的提升空间。

另外,在后期的规划中,我们会让白描判断证件类型更智能,扫描的时候就判断出扫的是身份证,还是营业执照或者其他证件,进行更有针对性的后续操作。

目前主要通过邮件和白描的公众号反馈,基本能在 6 个小时内回复并处理用户的邮件和公众号留言。

第一是流程更简单,打开就直奔主题;第二是识别准确度确实比较高,因为目前市面上的识别引擎有很多,白描用的是最贵的高精度的那种;第三是价格合理,性价比高,很多同类型的 app 都是订阅制,一年几百块,而目前白描最高级的会员才 30 块,而且是永久的,关键是识别效果更好。

这个想法依然来自于女朋友的需求,因为做独立创作需要自由高效地安排和记录时间,目前市面上的时间管理软件,她用的都不是很顺手,于是她就自己设计了一个。当然,刚认识她的时候,我就想为她做一个 app 来推送她的作品,她真的很有才华。我也没想到最后可以这样曲线救国地实现了我的愿望。

两个西柚是一个帮你与时间相处的时光记录者,集日程安排、待办提醒、日记于一身,还有那么一点与众不同的美感 —— 充满故事的氛围音乐和每天新鲜更新的壁纸。

两个西柚除了时间管理的功能好用之外,最大的特色就是它还有自己的内容 —— 每日更换的壁纸和不断更新的氛围音乐,这些壁纸完全都是女朋友原创,包括摄影、绘画,每个周都要为此专门画一幅画。氛围音乐和日程提醒铃声也完全是她自己创作的,她弹琴,去外面收集一些大自然的声音,还写下当时发生的故事,放在两个西柚里的每一首氛围音都有它的故事。

开发上的难度其实并不是最大,主要是逻辑上要想的更完善,想做到把她想要有的功能集于一个 app 上而并不显得繁琐,她会把功能都设计好,要说难度其实主要是内容的坚持,比如去收集声音,坚持每天更新壁纸,这是一种「甜蜜的负担」。

两个西柚拥有日记和待办工具两种功能,和市面上的 App 相比更文艺和另类,你们是如何「教」会用户使用的?

目前还没有教,更多的是靠用户自己去探索和发现,能做的就是让 app 更易用,以人为本,上手就会。后面也会考虑加入一些引导,解锁更多使用小技巧。

比如 App 的名字,两个西柚,就来自 I want to see you(我想要两个西柚 / 我想见你)的梗,是一句情话(羞涩)。

其实还有一些好玩的彩蛋啦,比如在某一个氛围音的介绍里提到了白描。比如点亮当天的壁纸会获得两个西柚,也蛮期待用户自己发现更多埋伏在细节里的彩蛋的。

目前已经有成品的就是白描和两个西柚啦,接下来还有几款在想法碰撞中,目前刚讨论出了名字图标和定位。

一起做 app,我们刚好都可以做自己更擅长的部分,就感觉这是「全天下最完美的阵容」,能够跟女朋友一起为一个产品付出,也是非常珍稀的体验。增进感情,及时了解对方的想法这些都是副产品了。

目前在 iOS 13 运行都正常,白描的深色模式已经适配完成,近期就会发布,还在考虑两个西柚是否需要加入深色模式。

第一是「西江月」,一款诗词软件,每天遇见一首诗 / 词,让你不经意间可以读一下。其次还可以根据分类查看诗词,可以搜索诗词,可以收藏诗词。这个 app 的界面非常简洁,略带一丝古风,非常适合喜欢读诗的朋友。「西江月」也是 App Store 推荐常客。

另一款是「晓时」,一款世界时间查看的软件,可以看不同城市的当前时间、日出日落以及在世界中的位置。

用户的心也是肉做的,非常敞开地面对用户的反馈,并且及时交流,把结果反映在产品的进步上。另外就是在产品的细节部分加入一些个人化的心思,用心了,用户会感觉到的。

耐心和同理心,据说是打动女朋友的地方,在做 app 这件事上也同样需要,能够站在用户的角度去思考问题,产品从一个个人想法到后来被越来越多的人使用,没有特别顽强的耐心真的做不到。

机遇我觉得就是,做一个 app 越来越容易了,有很多现成的框架和开源代码,有什么好想法就尽快付诸行动吧。

挑战我觉得有这么几个,一是推广成本越来越高,独立开发者的精力资力有限,如何能让更多用户知道自己的产品;二是盗版猖獗,反盗版道路艰辛,作为开发者还需要亲身上阵打击盗版维护正版用户(以及自己)的合法权益。

完全是很天然的决定,她主要做产品设计、UI 设计以及自己的创作,比如绘画,写文章;我主要负责技术实现、产品运营和推广。

起床之后先工作一波,然后早饭(大部分时间自己做),继续工作,午饭(大部分时间自己做),继续工作,锻炼, 晚饭(大部分时间自己做),阅读,睡觉。

相关案例查看更多