利用Gemini提取论坛高楼帖子里面的有用信息

相信泥潭很多用户都撸了Google One AI Premium w 2TB Storage 免费15个月 学生🧑‍🎓
那么如何利用Gemini帮我们爬楼呢?
直接扔给Gemini一个论坛帖子的连接的话,是不管用的:


这个时候,就需要把论坛网页转存为PDF,然后喂给Gemini
对于小于1000回复的帖子,直接在网页上按Command+P打开打印版网页,然后另存为PDF再上传给Gemini即可:

对于大于1000回复的帖子,你可以选择以同样的方式打开打印版网页,然后拉到页面最下方点“下一页”,但如果这个帖子回复很多,你按几次“下一页”之后就会被论坛限流,无法打开打印版网页

如果想直接访问某个帖子的最新回复的打印版网页的话,它的URL是 https://www.uscardforum.com/t/topic/{topic_id}/print?page=x
x代表页数,论坛打印版网页的默认分页是1000帖一页,比如对于帖子 【摸鱼第七季】為什麼不能摸鱼?豆老師的初心呢?! ,它最新的700多条回复就可以从 https://www.uscardforum.com/t/topic/402895/print?page=8得到
然后你就可以问它各种问题了 :yaoming:

12 个赞

那么问题来了,可以问隐藏分区吗

不可以……因为隐藏分区的帖子你即使有URL也打不开的吧

谢谢你,让我对自己更了解了:troll:

@aqua 介绍过泥潭的链接后面基本上都可以加.json,这个东西能直接喂给ai吗?比如说利用Gemini提取论坛高楼帖子里面的有用信息

我试了下,7K帖的高楼的JSON版似乎也很短,感觉肯定不是全部帖子信息: 【摸鱼第七季】為什麼不能摸鱼?豆老師的初心呢?!

肯定分页了啊,不然你浏览器直接爆炸了。我是觉得读json的成本应该比pdf低?

1 个赞

那这些信息会进入gemini未来的数据库吗?

我不会被谷歌拉黑,以后不能跳槽过去吧…完了

1 个赞

我先过去探探路

你发言不多,应该还没被Gemini收录,应该比较安全:troll:

记得到时候带带我

也有可能明年直接退休了

打算进修一下,当羽毛球教练。

那我是不行,怎么也得再来四五六七年…