使用者討論:Air7538/沙盒02
外觀
import pywikibot
import re
import time
from collections import defaultdict
site = pywikibot.Site('zh', 'wikipedia')
gen = site.newpages(namespaces=0, patrolled=False, returndict=True)
pagetext = ""
catext = ""
userlist = defaultdict(int)
sum = 0
for pageCat, info in gen:
# print(pageCat.title()) #未巡查条目列表
# print(pageCat.text)
if not re.search(r'\[\[(Category|分類|分类|category):|{{(Uncategorized|Copyvio|消歧義|Notability|bd)', pageCat.text):
catext = catext + "[[" + pageCat.title() + "]]、"
# print(catext)
sum += 1
userlist[info['user']] += 1
# print(userlist)
userlistcnt = defaultdict(list)
for user, cnt in userlist.items():
if cnt <= 1:
continue
userlistcnt[cnt].append(user)
for cnt, users in sorted(userlistcnt.items()):
pagetext += str(cnt) + "条 "
pagetext += '、'.join(users) + "\n\n"
page = pywikibot.Page(site, "User:Air7538/沙盒02")
localtime = time.asctime(time.localtime(time.time()))
page.text = "此时共有" + str(sum) + "条条目未巡查,当前创建未巡查条目最多的用户:\n\n" + pagetext + "以下条目可能存在潜在的分类问题:\n\n" + catext + "\n\n统计于:" + localtime
print(page.text)
page.save("维护页面:未巡查条目 and 潜在分类问题。v2")
Q & A
[編輯]- 特別感謝Xiplus對程式碼的修改(Special:diff/65150400),此次變更已經於Special:diff/65151250推送到Toolforge上。另外每小時此討論頁對應的沙盒02都會被重寫,除自動更新外所有對沙盒02的修改均不會得到長期保存。
Q:為什麼篩選的有紅字條目?
- A:默認Pywikibot似乎不會檢查近期頁面移動,很多紅字條目都是被移動過的。
Q:為什麼消歧義有如N字消歧義這樣的分類還是被選中了?
- A:因為N字消歧義是模板代入的,還有很多這樣的情況沒有被過濾出來。
- 最後感謝迴廊彼端的提醒(互助客棧其他版2021年4月),原來有一個特殊頁面叫Special:未歸類頁面。我似乎又在「造輪子」了 囧rz……
--Air7538(留言) 2021年4月11日 (日) 04:25 (UTC)
判斷分類不正常的幾種情況
[編輯]- 頁面wiki文本沒有分類的:
- [[Category: 不在wiki文本內,
- [[分類: 不在wiki文本內,
- [[分類: 不在wiki文本內,
- [[category: 不在wiki文本內。
- 其他情況:
- {{Uncategorized 頁面wiki文本已經被標記未分類維護模板,
- {{Copyvio 頁面正在進行版權驗證,
- {{消歧義 頁面是消歧義,
- {{Notability 頁面不符合維基百科的關注度要求,
- {{bd 頁面存在生卒年份模板,可能存在的嵌入分類。