-
有两类,一类是通过 Regex 替换,一类是从 Context 进去。但是不是所有的模型都支持从 Context。目前我做了 Regex,但是从 Context 的方法效果比较一般。最近我比较忙,没有空研究得太深入。
-
这一个主要是需要对用户的 accessibility 有比较多的侵入,我觉得不是特别值得做。而且我不确定它是不是通过 LLM 来做到的。
以上内容都是通过听写加上 AI Action 得到的,我觉得效果也还不错。
有两类,一类是通过 Regex 替换,一类是从 Context 进去。但是不是所有的模型都支持从 Context。目前我做了 Regex,但是从 Context 的方法效果比较一般。最近我比较忙,没有空研究得太深入。
这一个主要是需要对用户的 accessibility 有比较多的侵入,我觉得不是特别值得做。而且我不确定它是不是通过 LLM 来做到的。
以上内容都是通过听写加上 AI Action 得到的,我觉得效果也还不错。
公司让用super whisper。这个和它哪个好用?
这种替换是直接语言识别的时候就替换了
还是文本识别出来之后再进行文本替换啊
STT后替换的话我发现有很多词会有相当概率的别字 不知道这种怎么处理
懒人伸手一下:
如果只需要中英文, 说的话没啥隐私的, 这个比豆包语音输入法有啥incremental 好处吗?
个人经验,豆包准确性还是挺不错的了,够用.
最近尝试了豆包输入法,发现它竟然可以说话的时候字就在输入的地方冒出来(而不是在什么其他地方显示),和真的IME一样呢。然后停下来它再会做一次update。
Hoah有没有办法做到这样?