Chao
1
本帖子所有内容都是用 Typeless 说出来的,当然之后做了点简单的改动。
很久以前,跟电脑或者任何人交流的方式都很简单,最早肯定是以打字为主。
这里有一个非常大的 asymmetry 在这里。打字一分钟100字。但读文字的速度,可能能达到 400 字/分钟,因为用户也能快速skip,阅读的话,速度甚至可以达到 2000 字/分钟。
后来微信上加发语音功能。但语音其实有很多让人不爽的地方,比如:
- 对很多人来说,发语音本身是不尊重的。
- 有一段时间,语音实际上是不可以转换成文字的。现在语音就算是可以转换成文字,但是它在整个生态里面用起来也没有那么舒服,对吧?
- 语音呢,有时也会发现修改起来稍微有点难。可能自己说了一段话,然后马上发现不对,又要改一改。
发语音对自己来说是非常爽的,但对于对方来说,是非常不爽的。
使用声音的时候,输入和输出反而是比较 symmetric 的。我说话的速度有多快,你听到的速度就是什么样的。一般人说话的速度,也是所有人都是可以接受听力速度。
但听的速度还是比上比看的速度要慢非常非常多。
我现在开始使用一个叫 Typeless 的软件。你可以说一段话,然后它可以把它变成文本的形式,可以直接把这个文本形式发出去。这里有一个非常大的 asymmetry 在这里。并且一些常见的功能也可以搞定。比如说,你刚才说了一个东西,后来觉得错了要改掉,直接在口语中说一下,它也可以解决。
我因为不发语音,总是打字,甚至是在手机上打字,所以速度其实更慢一点。打字越多,浪费的时间就越多。现在利用这些软件,我就可以省下这一笔时间,而且也不浪费其他人的时间。
一个免费的搞法,直接利用豆包。整体测试不如Typeless。
2 个赞
个人体会是:很多人发wx语音的时候,有很多复读和语气词,拉低了沟通效率,强迫对面必须花几秒听完才能知道后面的内容,和阅读速度相比大打折扣。后来有了语音转文字才逐渐好转
不是很多输入法都可以语音输入,自动转换成文字,然后自己可以再编辑么
这种就挺有效率的,也不会对别人造成负面影响
1 个赞
没有asymmetry,要是能把一篇文章的图片直接打印出来还是比说要快的
但是免费版的typeless 只有4k个词 目前好像也没有那么诱人到我愿意付费
这个能实现了吗?那我还是值得去试一试的,感谢推荐。
但这个 Typeless 的价格有点劝退,年费订阅才能控制到 12 刀一个月。
接着淘宝搜了一下,发现这玩意还有 refer,但 refer 一个人的奖励还不够付月费的
。
刚刚看了一下有免费一个月的使用,那还不错,我先享受一下。本来最近腱鞘炎就难受得要死。
感觉未来我会成为这个产品的年费用户,但说实话真的好贵。
搜狗输入法就可以转文字,语音的问题是会有很多的语气停顿、思考和废话,如果你不修饰的话反而是非常不尊重人的表现。但是如果要修饰掉这些卡顿和错误的话,那就不如打字。其次是很多人有地方口音,你确定AI都能get到所有的口音之间对每个字细微的差别和变化?
我猜它背后先是一个语音转文字的微量模型,然后接一个小模型去做一部分的 thinking,负责组织格式、语气等细节。反正它一定是由两步组成的。
其实免费产品可以体验一下豆包输入法,但它的一个大问题是:基本上没办法处理语气停顿的部分。虽然豆包的识别能力已经很高了,但因为它需要跳转软件,实际生活中的使用体验很难受,根本没法用。
再比如 Poke (Poke.ai),他们的产品响应在某些情况下已经算很快了,底层是用 Gemini 2.5 Flash 做的。我目前体验下来,它的响应速度基本足够应对我大部分需要打字的场景。
比如用于 vibe coding 就绝对够用。配合一个 PPT 演讲笔:一个键按住说话,另一个键设为 Enter 键,直接就能实现双手远离键盘和鼠标的操作。
1 个赞
Cboe
18
读一段文字肯定比打字快,但边想边读和边想边打字可能就差不多了,而且打字好修改