Eric
1
相信泥潭很多用户都撸了Google One AI Premium w 2TB Storage 免费15个月 学生🧑🎓
那么如何利用Gemini帮我们爬楼呢?
直接扔给Gemini一个论坛帖子的连接的话,是不管用的:
这个时候,就需要把论坛网页转存为PDF,然后喂给Gemini
对于小于1000回复的帖子,直接在网页上按Command+P打开打印版网页,然后另存为PDF再上传给Gemini即可:
对于大于1000回复的帖子,你可以选择以同样的方式打开打印版网页,然后拉到页面最下方点“下一页”,但如果这个帖子回复很多,你按几次“下一页”之后就会被论坛限流,无法打开打印版网页
如果想直接访问某个帖子的最新回复的打印版网页的话,它的URL是 https://www.uscardforum.com/t/topic/{topic_id}/print?page=x
x代表页数,论坛打印版网页的默认分页是1000帖一页,比如对于帖子 【摸鱼第七季】為什麼不能摸鱼?豆老師的初心呢?! ,它最新的700多条回复就可以从 https://www.uscardforum.com/t/topic/402895/print?page=8得到
然后你就可以问它各种问题了 
17 个赞
Eric
3
不可以……因为隐藏分区的帖子你即使有URL也打不开的吧
ctzsm
5
@aqua 介绍过泥潭的链接后面基本上都可以加.json,这个东西能直接喂给ai吗?比如说利用Gemini提取论坛高楼帖子里面的有用信息
Eric
6
我试了下,7K帖的高楼的JSON版似乎也很短,感觉肯定不是全部帖子信息: 【摸鱼第七季】為什麼不能摸鱼?豆老師的初心呢?!
ctzsm
7
肯定分页了啊,不然你浏览器直接爆炸了。我是觉得读json的成本应该比pdf低?
1 个赞
打豆豆
11
你发言不多,应该还没被Gemini收录,应该比较安全
记得到时候带带我
henry
14
pdf的办法好用,但是马上被限制了。 这短时间能用几次?多久reset?
json每次只有20个帖子,很慢。
1 个赞
咕的鹦鹉宁
16
能不能写个油猴脚本
自动翻页抓取用户发言
pdf太大了