User talk:Air7538/沙盒02
外观
import pywikibot
import re
import time
from collections import defaultdict
site = pywikibot.Site('zh', 'wikipedia')
gen = site.newpages(namespaces=0, patrolled=False, returndict=True)
pagetext = ""
catext = ""
userlist = defaultdict(int)
sum = 0
for pageCat, info in gen:
# print(pageCat.title()) #未巡查条目列表
# print(pageCat.text)
if not re.search(r'\[\[(Category|分類|分类|category):|{{(Uncategorized|Copyvio|消歧義|Notability|bd)', pageCat.text):
catext = catext + "[[" + pageCat.title() + "]]、"
# print(catext)
sum += 1
userlist[info['user']] += 1
# print(userlist)
userlistcnt = defaultdict(list)
for user, cnt in userlist.items():
if cnt <= 1:
continue
userlistcnt[cnt].append(user)
for cnt, users in sorted(userlistcnt.items()):
pagetext += str(cnt) + "条 "
pagetext += '、'.join(users) + "\n\n"
page = pywikibot.Page(site, "User:Air7538/沙盒02")
localtime = time.asctime(time.localtime(time.time()))
page.text = "此时共有" + str(sum) + "条条目未巡查,当前创建未巡查条目最多的用户:\n\n" + pagetext + "以下条目可能存在潜在的分类问题:\n\n" + catext + "\n\n统计于:" + localtime
print(page.text)
page.save("维护页面:未巡查条目 and 潜在分类问题。v2")
Q & A
[编辑]- 特别感谢Xiplus对程式码的修改(Special:diff/65150400),此次变更已经于Special:diff/65151250推送到Toolforge上。另外每小时此讨论页对应的沙盒02都会被重写,除自动更新外所有对沙盒02的修改均不会得到长期保存。
Q:为什么筛选的有红字条目?
- A:默认Pywikibot似乎不会检查近期页面移动,很多红字条目都是被移动过的。
Q:为什么消歧义有如N字消歧义这样的分类还是被选中了?
- A:因为N字消歧义是模板代入的,还有很多这样的情况没有被过滤出来。
- 最后感谢迴廊彼端的提醒(互助客栈其他版2021年4月),原来有一个特殊页面叫Special:未归类页面。我似乎又在“造轮子”了 囧rz……
--Air7538(留言) 2021年4月11日 (日) 04:25 (UTC)
判断分类不正常的几种情况
[编辑]- 页面wiki文本没有分类的:
- [[Category: 不在wiki文本内,
- [[分類: 不在wiki文本内,
- [[分类: 不在wiki文本内,
- [[category: 不在wiki文本内。
- 其他情况:
- {{Uncategorized 页面wiki文本已经被标记未分类维护模板,
- {{Copyvio 页面正在进行版权验证,
- {{消歧義 页面是消歧义,
- {{Notability 页面不符合维基百科的关注度要求,
- {{bd 页面存在生卒年份模板,可能存在的嵌入分类。