【吼蛙】Vibe了一个 Mac 听写转文字LLM后处理的App (新增选中文本一键处理)

  1. 有两类,一类是通过 Regex 替换,一类是从 Context 进去。但是不是所有的模型都支持从 Context。目前我做了 Regex,但是从 Context 的方法效果比较一般。最近我比较忙,没有空研究得太深入。

  2. 这一个主要是需要对用户的 accessibility 有比较多的侵入,我觉得不是特别值得做。而且我不确定它是不是通过 LLM 来做到的。

以上内容都是通过听写加上 AI Action 得到的,我觉得效果也还不错。

1 个赞

公司让用super whisper。这个和它哪个好用?

这种替换是直接语言识别的时候就替换了
还是文本识别出来之后再进行文本替换啊

STT后替换的话我发现有很多词会有相当概率的别字 不知道这种怎么处理

懒人伸手一下:
如果只需要中英文, 说的话没啥隐私的, 这个比豆包语音输入法有啥incremental 好处吗?
个人经验,豆包准确性还是挺不错的了,够用.

最近尝试了豆包输入法,发现它竟然可以说话的时候字就在输入的地方冒出来(而不是在什么其他地方显示),和真的IME一样呢。然后停下来它再会做一次update。

Hoah有没有办法做到这样?