Wikipedia:Sarcini pentru roboți/Arhivă5
Nu scrieți mesaje în arhivă pentru că probabil nu vor fi citite. Dacă doriți să continuați o discuție arhivată aici, copiați fragmentul care vă interesează și reporniți discuția la pagina relevantă. |
Bună ziua! În articolele despre obiecte NGC, se pot/poate:
- Adăuga legături interne către cataloage ([1]);
- Adăuga {{Portal bar|Astronomie|Galaxii}} în subsolul articolelor? Mulțumesc! --FonAfon (discuție | contribuții) 12 noiembrie 2019 15:03 (EET)
- Respectiv {{Portal bar|Astronomie|Stea}}, în funcție de subiectul articolului. --FonAfon (discuție | contribuții) 12 noiembrie 2019 15:50 (EET)
- Sunt contra adăugării de legături interne în titlu (ăla din introducere) și în header-ul infocasetei. Legătură la New General Catalogue avem în subsolul paginii. Cu restul sunt de acord. // Gikü vorbe fapte 12 noiembrie 2019 15:56 (EET)
- Ok. --FonAfon (discuție | contribuții) 13 noiembrie 2019 15:30 (EET)
- +Mutarea formatului ciot deasupra casetelor NGC și a barei cu portale. --FonAfon (discuție | contribuții) 23 ianuarie 2020 19:03 (EET)
- Ok. --FonAfon (discuție | contribuții) 13 noiembrie 2019 15:30 (EET)
- Sunt contra adăugării de legături interne în titlu (ăla din introducere) și în header-ul infocasetei. Legătură la New General Catalogue avem în subsolul paginii. Cu restul sunt de acord. // Gikü vorbe fapte 12 noiembrie 2019 15:56 (EET)
NGC 54, cum deosebește robotul stelele de galaxii?--Strainu (دسستي) 26 ianuarie 2020 15:06 (EET)
- @Strainu: Dacă introducerea este „este o stea”, „este un roi deschis”, „este o nebuloasă de emisie”, „este o nebuloasă de emisie și un roi deschis”, „este un roi globular”, atunci se poate adăuga „{{Portal bar|Astronomie|Stea}}”. Dacă introducerea este „este o galaxie spirală”, „este o galaxie spirală barată”, „este o galaxie lenticulară”, „este o galaxie eliptică”, „este o galaxie”, „este o interacțiune de galaxii”, se poate adăuga „{{Portal bar|Astronomie|Galaxii}}”. --FonAfon (discuție | contribuții) 26 ianuarie 2020 15:23 (EET)
(printre|dintre) (cei|cele) mai...
modificare[după o idee de Dan Mihai Pitea] Propun să adăugăm {{fe}} la sfârșitul frazelor care conțin afirmații de genul "printre cele mai..." fără a avea vreo sursă (<ref>
sau {{Sfn}}) între "mai" și primul punct.
Aș fi vrut să lucrez și pe expresiile fără "printre" dar nu știu cum să identific corect și complet premiile ("cel mai bun..."). Mă poate ajuta cineva cu ceva idei aici?--Strainu (دسستي) 9 aprilie 2020 13:25 (EEST)
- Mai bine nu, e nevoie de verificare, nu e adăugare automatică de etichete care vor rămâne cu anii acolo. --Mihai (discuție) 16 aprilie 2020 23:46 (EEST)
- La Cafenea propusesem o soluție pentru expirarea {{nc}}, s-ar putea de extins ideea și pentru {{fe}}, {{co}} etc. // Gikü vorbe fapte 16 aprilie 2020 23:58 (EEST)
- Din punctul meu de vedere e mai constructiv dacă sunt verificate și corectate de către un homo sapiens 3 articole decât dacă sunt adăugate automat etichete în 10.000. --Mihai (discuție) 17 aprilie 2020 00:04 (EEST)
prolific --> productiv
modificareAvem de-a face cu folosirea greșită a cuvântului „prolific”. Prolific (de la „proles”) înseamnă „cu mulți copii”, respectiv „care se înmulțește repede”. Ar fi bine dacă un robot ar fi programat să înlocuiască prolific cu productiv în cazul tuturor biografiilor (scriitori, astronomi, fotbaliști etc.). Informația că aceștia ar fi fost prolifici nu este enciclopedică. Termenul trebuie păstrat la articolele despre plante, animale etc. (Lycosa prolifica, Limba mielului ș.a.m.d.). --Mihai Andrei (discuție) 23 aprilie 2020 12:34 (EEST)
- Nu e cazul, a se vedea [2]--Strainu (دسستي) 23 aprilie 2020 14:53 (EEST)
- Păcat că vă pripiți și că nu vreți o exprimare precisă. Înțelesul termenului este clar: [3]. Dacă doriți o enciclopedie, atunci stăviliți folosirea improprie a cuvintelor. Că doar nu-i putem lăsa pe copii să descopere [4] că Josef Bican ar fi fost „cel mai prolific fotbalist din toate timpurile.” --Mihai Andrei (discuție) 23 aprilie 2020 15:42 (EEST)
Introducere așezare
modificareSunt o mulțime de articole unde doar un robot poate adăuga {{subst:Introducere așezare}} după prima și totodată singura frază/propoziție.
Multe articole, ca de ex. acesta, ar trebui rescrise de la zero cu un robot.
După {{subst:Introducere așezare}} trebuie adăugată secțiunea Note; apoi secțiunea Legături externe cu site-ul oficial luat de pe wikidata; după secțiunea Vezi și la sfârșit prima dată trebuie pus formatul de navigare localități (aici {{Aachen}}), apoi ciot, apoi {{Informații bibliotecare}} (sau așa știam eu că este ordinea, se poate discuta).
Se poate începe cu articolele din aceste formate de navigare pe districte în Germania.--TerraFlorin [discuție] 11 iulie 2020 08:21 (EEST)
- {{Introducere așezare}} nu ar trebui introdus prin substituție. Rolul lui este să preia direct informațiile de la Wikidata și să le actualizeze pe măsură ce apar date noi sau suplimentare. Dar da, sunt multe articole despre localități care ar trebui regenerate. —Andreidiscuție 14 iulie 2020 11:45 (EEST)
Număr de articole create
modificareDacă tot s-a rezolvat cu secțiune goală, ar fi util un bot care să completeze și să actualizeze tabelele din Wikipedia:Lista wikipediștilor după numărul de articole. --Terraflorin (discuție) 12 februarie 2021 12:41 (EET)
- @Andreyyshore: e ceva ce vă interesează?--Strainu (دسستي) 12 februarie 2021 15:04 (EET)
- Am testat o interogare SQL pe Quarry. Se execută în aproximativ 2 minute și dă o eroare de 5–10 articole/utilizator față de XTools pentru mulți utilizatori cu cel puțin câteva sute de articole create. Potrivit rezultatelor mele, până acum:
- peste 9.999 de utilizatori autentificați (incl. roboți) au creat cel puțin un articol (posibil să fie în jur de 11.214, dar am trunchiat rezultatul);
- 3.666 de utilizatori autentificați (incl. roboți) au creat cel puțin două articole;
- 2.363 de utilizatori autentificați (incl. roboți) au creat cel puțin trei articole;
- 18.895 de articole au fost create de IP-uri – mai mult decât cel mai productiv utilizator uman autentificat (care a și inițiat cererea, de altfel) și mai puțin decât patru roboți.
- O listă de 5.000 de utilizatori, cum se dorește acum, mi se pare prea lungă și nici nu pot face departajări. Propun să mențin, în viitorul apropiat, o listă de doar 500 sau 1.000 de utilizatori (cu posibilitate de depășire în caz de egalitate pe ultimul loc – în prezent, pozițiile 491–500 ar fi ocupate de utilizatori cu câte 28 de articole create, iar pozițiile 975–1.037 ar fi pentru cei cu câte 9 articole create).
- Care credeți că ar trebui să fie pragul? — Andreyyshore D C 18 feb. 2021, 05:47 (EET)
- Cred că un prag de 10 articole e mai potrivit decât un număr de conturi. Dacă în viitor query-ul devine prea lung, putem mări pragul.--Strainu (دسستي) 18 februarie 2021 11:15 (EET)
- Am pornit de la lista cu 5.000 de utilizatori împărțită în 5 de pe en.wiki, dar evident trebuie să păstrăm proporțiile. 500 ar fi ideal sau e f bună și ideea lui Strainu. --Terraflorin (discuție) 18 februarie 2021 12:22 (EET)
- Am testat o interogare SQL pe Quarry. Se execută în aproximativ 2 minute și dă o eroare de 5–10 articole/utilizator față de XTools pentru mulți utilizatori cu cel puțin câteva sute de articole create. Potrivit rezultatelor mele, până acum:
- OK. O să merg deocamdată pe ideea lui Strainu.
Am mai adăugat o condiție: ca articolele să nu fie pagini de dezambiguizare.- De asemenea, cred că am găsit motivul discrepanței dintre numărătoarea mea și cea de la XTools și cred că a mea este mai corectă. Am luat, la întâmplare, cazul utilizatorului Solt, care la mine
apăreaapare cu 349 de articole,înainte de a elimina cele 9 dezambiguizări pe care le-a creat: pe XTools apare o listă de 350 de articole create, inclusiv „Hvar”, care mai apare și la utilizatorul Danutz. De fapt, articolul a fost creat de Danutz, dar a fost mutat o perioadă la „Hvar (oraș)” de Solt, împărțit în două articole de Andrebot și apoi reunificat de Ionutzmovie (cu mutarea istoricului de la o pagină la alta). Probabil există mai multe pagini cu situații similare. - Dacă nu sunt obiecții, o să încerc și niște teste automate peste câteva zile; vreau întâi să restructurez puțin codul pentru listele după numărul de editări. — Andreyyshore D C 18 feb. 2021, 16:51 (EET)
- Uneori crearea paginilor de dezambiguizare poate consuma mai mult decât cea a unui articol obișnuit... :) // Gikü vorbe fapte 18 februarie 2021 16:52 (EET)
- Am mai rulat o interogare pentru a determina câte articole există cu sau fără dezambiguizări, iar varianta care include paginile de dezambiguizare este mult mai apropiată de contorul de pe pagina principală. Retrag condiția. — Andreyyshore D C 18 feb. 2021, 17:12 (EET)
- În câteva minute ar trebui să se vadă prima modificare in-place. Am rescris mare parte din robot (am scăpat de callback hell și de jQuery) și de acum va fi mult mai simplu și mai rapid să adaug funcționalități noi și să controlez felul în care se înlănțuie toate operațiile. — Andreyyshore D C 2 mar. 2021, 23:58 (EET)
- Am mai rulat o interogare pentru a determina câte articole există cu sau fără dezambiguizări, iar varianta care include paginile de dezambiguizare este mult mai apropiată de contorul de pe pagina principală. Retrag condiția. — Andreyyshore D C 18 feb. 2021, 17:12 (EET)
- Uneori crearea paginilor de dezambiguizare poate consuma mai mult decât cea a unui articol obișnuit... :) // Gikü vorbe fapte 18 februarie 2021 16:52 (EET)
Teoria coardelor
modificare[5] [6] Solicit un bot care să schimbe [[Teoria corzilor]] în Teoria coardelor (și să mai și patruleze pe viitor dacă mai apar astfel de editări). Sunt 30 de elemente care necesită această modificare. --Terraflorin (discuție) 12 martie 2021 13:39 (EET)
- Realizat. --Mihai (discuție) 13 martie 2021 08:06 (EET)
- Făcusem inițial numai linkurile, dar între timp am înlocuit sintagma și în articole și la Wikidata; mai erau în 23 de articole și linkuri către teoria supercorzilor -> teoria supercoardelor (transcluse, ar trebui să se rezolve după actualizarea cache-ului). Dar ca să fie clar, am făcut asta cu find and replace, nimic fancy, deci nu e un task recurent. --Mihai (discuție) 13 martie 2021 09:42 (EET)
GFDL license update
modificareHi! There are 425 files left in Categorie:Wikipedia license migration candidates. My guess is that about 300 of them are eligible for a relicense because of the upload date. I made a few edits like Special:Diff/14243238 with my bot. Those edits were made on old uploads with an -excepttext:”(opt|out|VRT|OTRS)”. I wonder if any local bot users have time to fix or if I should do it with my bot. Next question is if 425 edits are too many to do without a bot flag? If I do it like Special:Diff/14243149 it will not be with a bot flag so the result is the same. I think all 224 files on Utilizator:MGA73/teste are eligible except if they have an "opt-out" or an OTRS. So they should be easy to fix with a bot. --MGA73 (discuție) 26 iunie 2021 13:59 (EEST)
- I moved this section here so it can be discussed more broadly.--Strainu (دسستي) 26 iunie 2021 21:08 (EEST)
The question is if anyone would like to fix it? If yes: Great, thank you. If no: Do I need a bot flag or can I do those few edits without a flag? --MGA73 (discuție) 2 iulie 2021 17:01 (EEST)
This code should do the trick if anyone with a bot would like to run it:
pwb.py replace.py -lang:ro -family:wikipedia -links:"User:MGA73/teste" -putthrottle:5 -dotall -regex -nocase -summary:"Eligible for [[Wikipedia:Image license migration|GFDL relicense]]. Uploaded before November 2008." ”\{\{\s*(GFDL)\s*\}\}” ”{{\1|migration=relicense}}” -excepttext:”(opt|out|VRT|OTRS)”
--MGA73 (discuție) 10 iulie 2021 20:47 (EEST)
- Realizat--Strainu (دسستي) 10 iulie 2021 21:43 (EEST)
Thank you Strainu! Files from before August 2009 should be okay too unless they are from the Internet. So this time we should also exclude www and http. This code should do the trick:
pwb.py replace.py -lang:ro -family:wikipedia -links:"User:MGA73/teste" -putthrottle:5 -dotall -regex -nocase -summary:"Eligible for [[Wikipedia:Image license migration|GFDL relicense]]. Uploaded before August 2009." "\{\{\s*(GFDL)\s*\}\}” ”{{\1|migration=relicense}}" -excepttext:"(opt|out|VRT|OTRS|www|http)"
--MGA73 (discuție) 11 iulie 2021 01:07 (EEST)
- Strainu I think if you could do the run above then the number of files in Categorie:Wikipedia license migration candidates would be less than 100. That could be fixed manually. --MGA73 (discuție) 15 iulie 2021 13:46 (EEST)
Realizat No more need for a bot. The rest needs to be checked manually or are allready on Commons and can be deleted. --MGA73 (discuție) 20 iulie 2021 20:58 (EEST)
Completarea citărilor
modificareÎn urma acestei discuții, Andrebot rulează zilnic pentru a completa citările date doar prin URL. Încearcă asta pentru toate notele din articolele modificate de la rularea anterioară, indiferent dacă notele respective au fost introduse acum sau mai demult.
Inițial m-am bazat doar pe taguri OGP și Citoid, dar nu mi-a plăcut ce ieșea la unele site-uri frecvent citate (anume IMDb, YouTube și Google Books). Acum am făcut niște tratări separate pentru acestea trei, folosind API-urile REST puse la dispoziție de site-urile respective (Google pare destul de liber cu permisiunea de utilizare a API-urilor, dar IMDb permite în varianta free doar 500 de interogări pe lună — sper să ne încadrăm, cred că e ok). Ca de obicei, mă uit periodic peste editările robotului și încerc să văd dacă mai sunt probleme. Mă puteți trage de mânecă dacă vedeți ceva. —Andreidiscuție 1 februarie 2022 23:01 (EET)
- Andrei Stroe, poate te interesează și [7]. Am făcut un translator pentru profit.ro so far care extrage autorul. Strainu (دسستي) 4 aprilie 2022 20:19 (EEST)
Bunuri culturale mobile clasate în Patrimoniul Cultural Național
modificareLa 10 ani după LMI a venit timpul pentru un nou import de mari dimensiuni de la Institutul Național al Patrimoniului (INP). INP a relansat recent portalul dedicat și a eliberat conținutul, text și imagini, sub licența CC-BY-SA. Propun deci două importuri, de text și imagine, precum și construirea unor secțiuni automate; toate operațiile sunt descrise mai jos în subsecțiuni dedicate pentru a putea fi discutate separat. Strainu (دسستي) 4 septembrie 2021 01:10 (EEST)
Importul listei
modificareImportul listei va merge după modelul de la LMI:
- Vom avea o pagină principală care va descrie în mare ce sunt bunurile culturale mobile clasate și va conține legături spre celelalte pagini.
- Din motive de limitări tehnice, lista va fi împărțită după domeniu și
categoriejudeț (Lista bunurilor culturale mobile din domeniul carte veche și manuscris clasate în categoria tezaurLista bunurilor mobile din Patrimoniul Cultural Național aflate în județul Bistrița-Năsăud (carte veche și manuscris) ar fi cel mai lung titlu). Ordonarea în cadrul listei se va face dupăjudețul unde se află obiectul (alternativ: după data clasării)categorie și data clasării. În cazul în care pentru unele județe depășim limitele, vom diviza și după categorie. - Lista va fi construită cu formate care vor reflecta structura tabelului de la sursă, nu neapărat în aceeași ordine. Pe lângă câmpurile de acolo, vom mai avea:
- Categoria (tezaur/fond)
- [opțional] Poziția (din ordinul de clasare)
- url_inp (id-ul paginii de detaliu; de exemplu în pagina [8], idul e 7BE87BAC335647B3B4495C32035F8F1C. E suficient pentru a reconstrui legătura către Cimec.)
- url_sursă (un URL către pagina obiectului pe site-ul deținătorului; NU va fi adăugat automat)
- Q (entitatea Wikidata; va fi populat în cazul în care va exista un import la Wikidata și va permite extragerea unor informații suplimentare)
- În pagina de discuții va fi inclus formatul {{DateCimec}} cu legături către lista filtrată (exemplu: carte veche + tezaur). Formatul va fi actualizat pentru a deveni mai flexibil.
- În primă fază nu voi include în listă detalii care nu sunt disponibile în listele Cimec, ci doar în paginile de detalii (e.g. descrierea, materiale etc.). Pe măsură ce codul va evolua și voi deveni mai familiar cu structura, putem discuta despre mai multe informații.
- Fiecare element va fi importat individual, cu autorul fișei și legătura către pagina de detaliu menționate în descrierea modificării pentru a respecta cerințele licenței.
- Listele vor fi categorisite după domeniu și categorie.
Completarea ulterioară a listei nu se va baza foarte mult pe contribuții automate, atât pentru că lista e deja aproape completă la sursă, cât și pentru că nu există un id ușor identificabil sau o listă unitară. Voi încerca să identific muzeele deținătoare, acolo unde ele există, folosind id-ul din ghidulmuzeelor, care este disponibil în pagina de detalii, și să introduc legături interne atunci când există articolul pe ro.wp. Identificarea autorilor se va face cu niște reguli simple și voi folosi Wikidata pentru a extrage data morții. Voi avea însă cu siguranță nevoie de ajutor pentru a realiza aceste asocieri. De asemenea, articolele Wikipediei, dacă există, vor trebui adăugate manual.
Întrebări deschise:
- E mai bine ca în interiorul listei să grupăm după județ sau după dată? Dacă folosim județul, putem împărți listele în secțiuni și apoi se pot realiza pagini per județ prin transcludere cu {{lsth:}}
- Putem găsi un titlu mai scurt pentru articole?Strainu (دسستي) 4 septembrie 2021 01:10 (EEST)
- Cam așa ar arăta tabelul. Va mai exista și o introducere și categorii.--Strainu (دسستي) 17 noiembrie 2021 02:13 (EET)
- @Accipiter Gentilis Q., @Gikü: dacă tot mi-ați băgat în seamă efortul, mai am o rugăminte. Aruncați-vă o privire pe listele deja create și spuneți-mi ce probleme vedeți. Cel mai probabil nu se vor afișa corect imaginile: e normal, e prima dată când sunt generate imaginile la dimensiunea aceea și există o limită de generare/ip; puteți ajuta dând refresh de mai multe ori. Mulțumesc! Strainu (دسستي) 4 decembrie 2021 19:00 (EET)
- În prima coloană din stânga cuvintele încep când cu literă mare, când cu literă mică. Ar fi necesară uniformizarea, preferabil fiind să înceapă cu literă mare
- La Bunuri mobile din domeniul arheologie trebuie musai una sau 2 coloane care să conțină date cel puțin despre localizarea temporală Epoca/Perioada, Etnie/Cultura. Asta le definește de fapt. Pot înlocui coloanele Clasare și/sau Categorie, pentru a nu aglomera lista cu date. Să presupunem că mâine pică siteul CIMEC, de unde se iau datele astea, când folosești o imagine într-un articol sau vrei să vei ce e cu ea ? La urma urmei când o pui într-un articol, scrii la explicații ceva de genul: "Amforă de ofrandă din Epoca bronzului Cultura Monteoru (+/- găsită la Bogdănești, județul Bacău)". De aceea, cel mai bine ar fi și o a treia coloană care să rezume locul descoperirii. Rezumând: pentru simplificare, coloanele Clasare și Categorie pot să dispară, info respective fiind fie scoase (rămânând accesibile doar prin linkul spre CIMEC) sau mutate în coloana Legături, sub forma unui link [http://clasate.cimec.ro/Detaliu.asp?k=F3DA9C3864E9496AAFAA7DB5F089F26F 2290/01.06.2010 - Tezaur; Poziția 2] O coloană disponibilă se poate obține mutând info din coloana Localizare: de exemplu în loc de Colecție particulară + Iordania --> Colecție particulară, Iordania, sau Muzeul de Mineralogie Baia Mare + Baia Mare, Muzeul de Mineralogie Baia Mare, Baia Mare
- Idem la Bunuri mobile din domeniul artă decorativă, trebuie să existe coloanele Datare, Școală, Material/Tehnică (text), cu sau fără scoaterea coloanelor Clasare & Categorie cu/fără mutarea info din coloanele respective la Legături.
- Idem la Bunuri mobile din domeniul artă plastică coloanele Datare, Școală, Material/Tehnică (text) Dimensiuni
- Idem la Bunuri mobile din domeniul documente Datare, Material, Tehnică, Dimensiuni
- Idem la Bunuri mobile din domeniul carte veche Datare, Material, Dimensiuni
- Idem la Bunuri mobile din domeniul etnografie Etnie/Cultură Loc de descoperire, Material Tehnică (Text) Datare Dimensiuni
- Idem la Bunuri mobile din domeniul istorie Datare, Școală, Loc de descoperire, Material/Tehnică (text) Dimensiuni
- Idem la Bunuri mobile din domeniul științele naturii Loc de descoperire, Dimensiuni
- Idem la Bunuri mobile din domeniul știință și tehnică Datare, Loc de descoperire, Material/Tehnică (text) Dimensiuni
- Dacă nu dispar coloanele respective (eu sunt pentru ca ele să dispară, ar fi necesare modificări de titluri pentru o claritatate suplimentară:
- Clasare (Nota Bene: formulare ambiguă) --> Ordin de clasare
- Categorie (Nota Bene: foarte vag) --> Categorie juridică (Nota Bene: de exemplu coloana Categorie (juridică) poate fi înlocuită pur și simplu cu o categorizare propriu zisă de tipul Categorie:Tezaur CIMEC sau Categorie:Fond CIMEC)
- Legături --> Fișă CIMEC
- Rezumând: ar fi de de la 2 la 5 coloane, din care 3 coloane se pot obține în locul coloanelor Localizare & (Ordin de) clasare & Categorie (juridcă) Info actuale din coloana Localizare pot fi transferate liniștit în coloana Deținător, iar coloana Categorie (juridică) poate fi înlocuită cu o categorizare propriu zisă de tipul Categorie:Tezaur CIMEC sau Categorie:Fond CIMEC). Info din coloana (Ordin de) clasare poate fi introdusă în coloana legături sub formă de link spre fișa CIMEC. Pinguiesc și pe @Asybaris01:, @Țetcu Mircea Rareș:, poate au idei mai bune.
Vă referiți la o listă realizată prin transcludere care să conțină toate bunurile județului ? Oricum lista județului e în categoria județului respectiv...„E mai bine ca în interiorul listei să grupăm după județ sau după dată? ”- Titlu: Bunuri culturale mobile (+/- clasate) în Patrimoniul Cultural Național (Nume Județ, Nume Domeniu). Pun mai jos variantele (actuală și propusă, pentru comparație):
- Bunuri mobile din domeniul arheologie clasate în patrimoniul cultural național al României aflate în județul Sibiu
- Bunuri culturale mobile clasare în Patrimoniul Cultural Național (Județul Sibiu, arheologie)
- Bunuri culturale mobile în Patrimoniul Cultural Național (Județul Sibiu, arheologie)
- @Strainu: vedeți mai sus. --Accipiter Gentilis Q.(D) 6 decembrie 2021 13:27 (EET) P.S. Ar fi trebuit să-mi dau cu părerea înainte de generarea tabelelor actuale, dar neavând pagina în supraveghere, până nu am fost pinguit și nu am accesat mai multe tipuri de liste nu mi-am dat seama de ce e de fapt important și ce nu.
- Din păcate nu e tocmai fezabil să generez formate diferite în tabele diferite. Aș putea să încerc să fac dump la toate câmpurile peste tot și să le controlez afișarea din Lua, dar sunt șanse mari ca la București, unde sunt mii de intrări în listă, să lovesc vreo limită oarecare a site-ului. Experimentăm, dar nu promit.
- Dacă nu se poate, o să pun categoria ca un header intermediar și scot Clasare și pun Datare. Eu eram interesat și dacă ar fi util de pus descrierea. Strainu (دسستي) 6 decembrie 2021 15:03 (EET)
- @Accipiter Gentilis Q., @Gikü: dacă tot mi-ați băgat în seamă efortul, mai am o rugăminte. Aruncați-vă o privire pe listele deja create și spuneți-mi ce probleme vedeți. Cel mai probabil nu se vor afișa corect imaginile: e normal, e prima dată când sunt generate imaginile la dimensiunea aceea și există o limită de generare/ip; puteți ajuta dând refresh de mai multe ori. Mulțumesc! Strainu (دسستي) 4 decembrie 2021 19:00 (EET)
- Cam așa ar arăta tabelul. Va mai exista și o introducere și categorii.--Strainu (دسستي) 17 noiembrie 2021 02:13 (EET)
- Bun, atunci ne referim la 3 coloane peste tot, toate 3 putând fi obținute din coloanele actuale. Una va fi o coloană care va include descrierea, descriere în care se importă inclusiv ceea ce ar fi pe celelalte +/- 3 coloane (intrările sun separate în fișele CIMEC și pot fi importate ca atare, presupun, diferențiat, pentru a popula descrierea). Când ziceți de descriere însă vă referiți la textul din partea de deasupra fișei CIMEC, nu ? Ar fi the best, să fie luate și info de acolo. BTW, aș renunța complet la chestii de genul 2241/08.06.2006 - Tezaur; Poziția 12, că în definitiv asta interesează în primul rând pe CIMEC și aproape de loc pe cineva care accesează Wiki și aș păstra doar linkul spre fișa CIMEC. --Accipiter Gentilis Q.(D) 6 decembrie 2021 15:09 (EET)
- Când spun nume de coloane, vorbesc de coloane din listă SAU elemente cu bold de pe pagina de descriere. De ex. la [9] descrierea este Seceră din bronz, cu nervură mediană și cu buton la mâner, are orificiu pentru prindere, patină bună. și coloanele disponibile pentru wiki sunt tip, titlu, descriere, deținător, domeniu, datare, epoca, loc de descoperire, material/tehnică, Fișă întocmită de, Fișă verificată de, Nr. Inventar, ordin de clasare.
- Atenție la numele paginilor, unele vor fi împărțite și după categorie (din motive de mărime). Nu prea sună bine Bunuri culturale mobile în Patrimoniul Cultural Național (Județul Sibiu, arheologie, tezaur), nu? Strainu (دسستي) 6 decembrie 2021 15:43 (EET)
- Bun, atunci ne referim la 3 coloane peste tot, toate 3 putând fi obținute din coloanele actuale. Una va fi o coloană care va include descrierea, descriere în care se importă inclusiv ceea ce ar fi pe celelalte +/- 3 coloane (intrările sun separate în fișele CIMEC și pot fi importate ca atare, presupun, diferențiat, pentru a popula descrierea). Când ziceți de descriere însă vă referiți la textul din partea de deasupra fișei CIMEC, nu ? Ar fi the best, să fie luate și info de acolo. BTW, aș renunța complet la chestii de genul 2241/08.06.2006 - Tezaur; Poziția 12, că în definitiv asta interesează în primul rând pe CIMEC și aproape de loc pe cineva care accesează Wiki și aș păstra doar linkul spre fișa CIMEC. --Accipiter Gentilis Q.(D) 6 decembrie 2021 15:09 (EET)
- Deocamdată sunt în pană de alte idei, cu referire la scurtarea numelui.--Accipiter Gentilis Q.(D) 6 decembrie 2021 17:15 (EET)
Am mai șurubărit la câmpuri și s-a dovedit că școala, locul de descoperire, materialul și dimensiunile apar în 10-11 domenii (din 11). Le-am introdus alături de datare într-o coloană numită "detalii tehnice". Am mai umblat și la descriere pentru a include mai multe câmpuri, ca la imagini (se va vedea mai ales la numismatică). Exemple în județul Vâlcea.--Strainu (دسستي) 10 decembrie 2021 02:30 (EET)
Principial vorbind se pare ok șurubăreala, așa cum e acum. Totuși nu apar toate detaliile relevante: de exemplu perioada (e.g. La Tène) sau cultura (e.g. import roman), ori materialul (e.g.bronz) - e.g. v. poziția 1 Amforetă de aici.--Accipiter Gentilis Q.(D) 10 decembrie 2021 09:09 (EET)
- Da, vom mai găsi sigur erori în date și vor trebui regenerate listele de mai multe ori. Am mai lucrat la cod pentru a putea genera listele și elementele din listă într-o ordine predictibila, pentru a nu încarca istoricul paginilor. Strainu (دسستي) 10 decembrie 2021 09:17 (EET)
- Noile câmpuri de descriere sunt vizibile la Bunuri mobile din domeniul județul Vaslui clasate în patrimoniul cultural național al României aflate în numismatică (tezaur). Strainu (دسستي) 10 decembrie 2021 11:34 (EET)
Ups ! Bunuri mobile din domeniul județul Vaslui clasate în patrimoniul cultural național al României aflate în numismatică (tezaur) --> ? Better = Bunuri mobile din domeniul numismaticii din județul Vaslui clasate în patrimoniul cultural național al României.--Accipiter Gentilis Q.(D) 10 decembrie 2021 11:50 (EET) P.S. Chiar are relevanță că e tezaur sau fond, pentru subdiviziunile listelor ? Nu ar putea fi pusă info de genul ăsta la detalii tehnice ? Azi mâine din fond trec în tezaur și poate nu ar strica să fie necesarul de muncă de revizuire setat din timp să fie mai puțin complex.
- @Accipiter Gentilis Q. listele trebuie împărțite când devin prea mari pentru MediaWiki. Puteți propune un alt criteriu care să existe la toate obiectele, dar nu sunt foarte multe... Strainu (دسستي) 10 decembrie 2021 14:52 (EET)
- Pai, na, cum nu ma pricep la detaliile tehnice nu am ce sa propun prea multe, ca se cheama ca imi dau cu parerea asupra unor lucruri de care nu am habar. Oricum, pentru mine e simplu sa tastez fa aia, fa ailalta... Nu ma doare creierul, ca nu le fac io...--Accipiter Gentilis Q.(D) 10 decembrie 2021 16:25 (EET)
Cam asta a fost ce a putut să facă robotul. Am implementat o metodă de reducere graduală a datelor până încap. Asta înseamnă că diferite liste au o cantitate diferită de informații. Articolul principal este Bunuri mobile clasate în patrimoniul cultural național al României.
Mai e o problemă (măricică) la Bunuri mobile din domeniul științele naturii clasate în patrimoniul cultural național al României aflate în municipiul București (tezaur), nu încape în limite orice i-aș face. Va trebui să modific manual tabelul, de exemplu scoțând deținătorul de tot (pentru că e unul singur).--Strainu (دسستي) 20 decembrie 2021 10:33 (EET)
Importul imaginilor
modificareImaginile vor fi importate la ro.wp direct din versiunea mare a sursei. Numele fișierului va fi <titlu>_(<domeniu>)_<ordin>_<data>_<categorie>_<cheie>.jpg (de exemplu Pieptene_os_(Arheologie)_3076_21.05.2021_fond_C34B657418444205A3A3E3D4DA913BDF.jpg), unde:
- <titlu> este titlul lucrării
- <domeniu> este domeniul lucrării
- <ordin> este numărul ordinului de clasare
- <data> este data clasării
- <categorie> este tezaur sau fond
<poziție> este poziția din ordin<cheie> este cheia de identificare a obiectului în baza de date (apare în URL-ul paginii de detalii)
Pagina de descriere a lucrării va conține formatele {{Information}} și {{cc-by-sa-4.0}}, precum și {{FOP Romania}} și {{Imagine liberă în viitor}} dacă autorul este un nume care poate fi identificat în Wikidata ca o persoană cu data decesului după 1 ianuarie 1952, {{tlc}} dacă autorul este gol sau data decesului este înainte de 1 ianuarie 1952, respectiv {{Autor necunoscut}} dacă autorul nu poate fi identificat la Wikidata. Formatul va avea următoarele câmpuri:
- descriere: conținutul câmpului omonim din pagina de detalii. Dacă există mai multe câmpuri ce conțin cuvântul descriere, atunci vor fi preluate toate, inclusiv numele câmpului (exemplu). Dacă nu există câmpul, va fi copiat câmpul titlu
- sursa: Legătură către pagina de detalii a obiectului, cu titlul ca text, sau, dacă nu există, textul "Institutul Național al Patrimoniului - Cimec"
- autor: conținutul câmpului omonim de la sursă, urmat pe o linie nouă de autorul fișei (din considerente de licențiere)
- data: conținutul câmpului datare, cu toate detaliile de acolo
- permisiune: textul "Vezi mai jos" cu legătură spre secțiunea de licențiere
Va fi nevoie de ajutor manual pentru clarificarea situației fișierelor marcate cu {{ Autor necunoscut}}. Imaginile vor fi categorisite după domeniu, categorie și județ.--Strainu (دسستي) 4 septembrie 2021 01:10 (EEST)
- Realizat--Strainu (دسستي) 29 octombrie 2021 00:31 (EEST)
- Aici este lista imaginilor care merită analizate pentru a vedea dacă pot fi libere. Strainu (دسستي) 29 octombrie 2021 01:02 (EEST)
Crearea de secțiuni dedicate în articolele despre muzee
modificareDupă modelul secțiunilor despre monumente istorice din paginile despre localități, propun realizarea unor secțiuni standard despre exponatele muzeelor care dețin bunuri clasate. Voi realiza acest lucru în faza a doua și voi avea mai multe detalii după ce voi termina importul. Dacă cineva vrea să preia procesul mai devreme, e binevenit(ă).--Strainu (دسستي) 4 septembrie 2021 01:10 (EEST)
- Am încercat câte ceva si am constatat că o listă "îngroapă" rapid (de la câteva zeci de elemente) orice articol. Nu cred că are sens să facem pagini dedicate, dar am putea experimenta mai departe in două direcții:
- galerii particularizate când sunt multe exponate
- ceva text mai mult sau mai puțin legat, atunci când există puține exponate, cu descrieri consistente. Strainu (دسستي) 6 decembrie 2021 00:42 (EET)
- Secțiunea respectivă poate fi sub forma unui tabel colapsabil cu stare implicită colapsată, care, să includă o subpagină transclusă. Vedeți de exemplu tabelul Distrugătoare și torpiloare participante la raidurile asupra rezervoarelor de petrol de la Constanța Distrugerea instalațiilor industriale petroliere din sudul României în 1916#Preambulul din Dobrogea. Dacă cineva va vrea să-l deschidă, îl va deschide.--Accipiter Gentilis Q.(D) 6 decembrie 2021 15:30 (EET)
Scrierea de articole noi
modificareÎn acest moment nu intenționez să scriu articole noi pe baza acestor date. Dacă acest lucru se va schimba, voi face o cerere diferită. Din nou, dacă cineva mi-o ia înainte, e binevenit(ă). Strainu (دسستي) 4 septembrie 2021 01:10 (EEST)
Feedback – artefacte
modificare@Strainu: Văd două artefacte majore provocate de importul de imagini:
- multe redirect-uri greșite
- categorizări stranii precum Categorie:Bunuri mobile clasate în patrimoniul național al României aflate în județul Germania și Categorie:Bunuri mobile clasate în patrimoniul național al României aflate în județul Elveția
// Gikü vorbe fapte 14 octombrie 2021 00:10 (EEST)
- Mulțumesc, am corectat categoriile pe care le-am găsit la Special:Categorii dorite.--14 octombrie 2021 15:49 (EEST)
- Am corectat și redirecționările, am uitat să anunț.--Strainu (دسستي) 17 noiembrie 2021 02:13 (EET)
Liste de localități
modificare@Andrei Stroe: Dacă ai apucat să scrii ceva cod, dă un semn.
Aceasta este o cerere de aprobare pentru un robot care să ruleze lunar, nesupravegheat, pentru a popula listele de localități din România, folosind Modul:UATList. Paginile afectate sunt:
- Județul nnn (Județul Argeș)
- Listă de localități din județul nnn (Listă de localități din județul Alba)
- Listă de comune din județul nnn (Listă de comune din județul Călărași)
În urma discuției anterioare rămăsese doar problema locației listelor. După ce m-am uitat la ce există, am următoarea propunere:
- paginile județelor, în secțiunea "Diviziunile administrative" (de creat/redenumit manual), vor conține doar UAT-uri, împărțite în subsecțiuni pentru municipii/orașe/comune. Secțiunea va trimite cu {{articol principal}} la Listă de localități din județul nnn. Dacă este disponibilă o hartă administrativă înainte de editarea automată a secțiunilor, robotul o va plasa și el (lista de imaginiva fi hardcodată). Dacă este disponibil un format numit {{Harta administrativă a județului nnn}}, el va fi plasat în locul imaginii (în ideea că vom avea hărți senzitive sau altceva mai interesant în viitor)
- paginile din seria Listă de localități din județul nnn vor conține toate localitățile, în formatul exemplificat la Utilizator:Andrei Stroe/Listă UAT Prahova. Vor fi incluse formatele {{Listele localităților din România pe județe}} și {{extinde|Județul nnn}}.
- paginile din seria Listă de comune din județul nnn vor redirecționa spre secțiunea relevantă din pagina județului. Toate formatele și meta-listele aferente vor fi șterse.
Voi reveni cu exemple pentru județul Argeș și eventuale ajustări ale propunerii după ce scriu codul. Strainu (دسستي) 28 decembrie 2021 21:35 (EET)
- Începusem mai demult, ieșise ceva-ceva, dar m-am luat cu altele. Aveam aici un început de generator de liste pe bază de Wikidata cum e și cel pentru loturile echipelor de fotbal. Dacă vrei să faci tu altceva, poți eventual să iei query-ul de acolo (dacă nu ai tu deja unul mai potrivit). Din ce am făcut eu, nu se pierde mare lucru. Ideea mea era să existe niște formate pentru fiecare linie de tabel, și era în Modul:UATList ceva de genul ăsta. —Andreidiscuție 29 decembrie 2021 10:41 (EET)
- Am implementat listele, le puteți vedea în Format:Listele localităților din România pe județe. Mai e o problemă de ordonare alfabetică (diacriticele vin la sfârșit) dar nu cred că e critică. Strainu (دسستي) 25 ianuarie 2022 14:46 (EET)
Revert automat bazat pe ORES
modificareRezumat
modificareÎn ultimii ani, încărcarea patrulatorilor a fost menționată de multe ori ca un bottleneck pentru Wikipedia română (vezi 1, 2 pentru ultimele discuții). Pe de altă parte, filtrele pe baza calității contribuțiilor de la schimbările recente par a fi puțin folosite.
Pentru a reduce încărcarea patrulatorilor, propun să implementez un robot fără flag care să facă revert automat la schimbările nepatrulate și nerevertuite realizate de oameni care au o probabilitate foarte mare să fie distructive.
Detalii ale propunerii
modificareRobotul (numit Revertbot PatrocleBot după câinele din Dumbrava minunată) va supraveghea în timp real schimbările recente cerând câte 50 de schimbări din spațiile de nume NS la fiecare X secunde. Va exclude din acestea schimbările patrulate și cele cu eticheta "Revenit". Pentru restul va cere de la ORES scorul pentru modelul damaging. În cazul schimbărilor care au probabilitatea să fie distructive mai mare de Y (0<=Y<=1), va încerca să revină asupra schimbării. În caz de eroare, va ignora problema și va lăsa schimbarea să fie analizată de oameni.
Schimbările vor fi fără flag de robot pentru a putea fi vizibile în schimbările recente și a minimiza conflictele de editare. Numărul de editări va fi relativ redus, probabil câteva zeci pe zi.
Analiză pe schimbările recente din 14 ianuarie 2022
modificareAm făcut o analiză pe cele mai recente 5000 de modificări patrulate + 5000 de modificări nepatrulate (în spațiile de nume din secțiunea următoare) și rezultatele sunt în tabelul de mai jos. Modificările sunt din 27 decembrie pentru cele nepatrulate și din 8 ianuarie pentru cele patrulate. Procent revenit înseamnă editări revenite din total, procent din total înseamnă procent din numărul de editări notate de ORES (aka din penultima linie), scor N/A înseamnă că nu există scor ORES. Liniile (în afară de ultima) sunt aditive, adică linia 2 conține și modificările din linia 1 ș.a.m.d.
Câteva concluzii:
- Există un procent mic (1,5-3%) de revizii care nu apucă să primească un scor ORES în MediaWiki. De cele mai multe ori, el este disponibil din alte surse (apelând direct ORES), deci nu ne afectează
- Peste 94% din modificările identificate de ORES cu probleme și patrulate sunt anulate, la fiecare categorie de scor, dar doar în jur de jumătate din cele nepatrulate. Asta înseamnă 3 lucruri:
- ORES e foarte bun spre extrem de bun în a identifica modificările problematice cu pragurile alese de echipă. Asta îmi dă încredere să cobor scorul folosit pentru revert.
- Până la 25% din totalul editărilor sunt nepatrulate (imposibil de spus pe câte s-a uitat cineva totuși...), lucru confirmat de un query în care am cerut împreună patrulate+nepatrulate și 76% au fost anulate. Putem folosi asta mai târziu pentru a vedea dacă timpul eliberat de robot a fost alocat tot pentru patrulare sau în alte scopuri.
- Reformulând punctul anterior, doar maxim jumătate din modificările nepatrulate chiar sunt nepatrulate. Trebuie analizat de ce restul nu sunt marcate ca patrulate.
- Pe Wikipedia română se face revert la 7-8% din totalul editărilor. Nu știu dacă e mult sau puțin.
- Modificările cu scor ≥0,95 reprezintă doar 0,1% din totalul editârilor analizate și 1,2% din cele anulate. Dacă rămânem la acest prag, robotul nu va avea vreun impact semnificativ asupra efortului de patrulare. Am modificat deci propunerea pentru a începe de la 0,95 și a coborî, dacă nu există prea multe pângeri, cu 0,01/lună până la 0,93. Acest scor ar prinde în jur de 7,5% din editările cu probleme și un pic mai mult de 1% din total. După câteva luni la 0,93 ar trebui făcută o evaluare și văzut cum s-au modificat procentele. Rezultatul ar trebui inclus și în discuția despre interzicerea editărilor prin IP.
Strainu (دسستي) 14 ianuarie 2022 00:51 (EET)
Scor | Nepatrulate | Patrulate | ||||||
Revenit | Total | Procent revenit | Procent din total | Revenit | Total | Procent revenit | Procent din total | |
≥0,95 | 4 | 6 | 67% | 0,12% | 3 | 3 | 100% | 0,06% |
≥0,94 | 8 | 13 | 62% | 0,26% | 7 | 7 | 100% | 0,14% |
≥0,93 | 19 | 37 | 51% | 0,74% | 17 | 18 | 94% | 0,37% |
≥0,92 | 41 | 83 | 49% | 1,66% | 33 | 34 | 97% | 0,70% |
≥0,91 | 71 | 158 | 45% | 3,16% | 54 | 56 | 96% | 1,16% |
≥0 | 481 | 5000 | 10% | 100% | 264 | 4846 | 5% | 100% |
N/A | 0 | 0 | N/A | N/A | 154 | 0% | 3% |
Configurare
modificareConfigurarea robotului va fi făcută de pe wiki, prin intermediul unei pagini din spațiul de nume MediaWiki. Robotul va detecta schimbările în lista de schimbări recente, iar ca variantă de rezervă, le va citi manual în fiecare noapte.
Următorii parametri vor putea fi configurați:
- NS - spațiile de nume de urmărit. Implicit: (Articole), Wikipedia, Fișier, MediaWiki, Format
- X - 10s inițial. Trebuie găsit un echilibru între load (nu vreau nici să ruleze în gol, nici să piardă editări) și latență (dacă întârziem mult, vor face revert patrulatorii și practic robotul nu va ajuta).
- Y - 0,95 inițial, coborând cu 0,01/lună până la 0,93. Pragul ORES este de 0,909 pentru "foarte probabil cu probleme", cu precizie de 75%. Ideea e să micșorăm pe cât posibil numărul de reveniri greșite, dar să analizăm totuși cât mai multe diff-uri.
- activ - true/false. Este oprirea de urgență pentru bot. Dacă se schimbă în false, robotul se va opri și nu va mai reporni decât manual.
- maintainer - inițial Strainu. Un utilizator care să fie notificat în caz de probleme
Detalii tehnice
modificare- permisiuni noi: utilizatorul va avea nevoie de drepturi de patrulare (e nevoie de o excepție de la reguli) pentru a putea face revenirea "oficială", care etichetează corect editarea asupra căreia s-a revenit.
- Limbaj de programare: Python
- Sursă:
TBD, probabil va fi lahttps://github.com/rowiki/oresreverter - programul va rula permanent, fiind repornit automat în caz de crash
- monitoring: în caz de eroare detectată, va fi notificat maintainerul prin email sau mesaje pe wiki
- raportare: săptămânal, robotul va publica un raport ce va conține:
- numărul de reverturi făcute
- numărul de schimbări nerevertuite foarte probabil cu probleme (aka cu scorul ORES între 0,909 și Y). Asta ne va permite să reglăm parametrul Y.
- numărul de erori întâlnite, defalcat conflictele de editare. Asta ne-ar permite să estimăm câte anulări au fost făcute de altcineva.
- numărul de intervaluri de X sec în care nu s-a întâlnit nicio editare de revertuit. Asta va permite reglarea lui X.
Notificări
modificareTaguiesc aici administratorii și patrulatorii pentru a avea o discuție extinsă asupra propunerii: Vali, KlaudiuMihaila, Mihai Andrei, Afil, Rsocol, Andrei Stroe, Firilacroco, Gikü, Ionutzmovie, Victor Blacus, Pafsanias, Dan Mihai Pitea, Alex Nico, NGC 54, AT09W, Accipiter Gentilis Q., Alin, Donarius, Kun Kipcsak, Luciandrei, Miehs, Mishu57, Nyook, Pocor, Polistul, Sîmbotin, Tgeorgescu, Voloh28.
Discuții
modificareComentați mai jos asupra propunerii, inclusiv aprobare explicită dacă sunteți de acord, vă rog. Strainu (دسستي) 12 ianuarie 2022 13:14 (EET)
- De acord, nu încape discuție. Îmi este neclar totuși cum se analizează modificările potențial distructive și cum se stabilește pragul Y, dar asta ține probabil de altă temă.--Kun Kipcsak (discuție) 12 ianuarie 2022 13:31 (EET)
- Kun Kipcsak, clic pe legătura spre ORES din descriere pentru detalii despre softul de analiză.--Strainu (دسستي) 12 ianuarie 2022 14:39 (EET)
- De acord cu siguranță! Chiar dacă ceva va merge total greșit, putem oricând opri robotul. Însă pe nivel ORES de .95 ne putem baza fără grijă. // Gikü vorbe fapte 12 ianuarie 2022 17:15 (EET)
- De acord--Accipiter Gentilis Q.(D) 13 ianuarie 2022 10:37 (EET)
- De acord. Ar fi de ajutor, mai ales în cazurile clare, pe care le vede ORES de la o poștă. —Andreidiscuție 13 ianuarie 2022 16:33 (EET)
- De acord --Donarius (discuție) 14 ianuarie 2022 19:16 (EET)
- De acord. Precizez câteva aspecte:
- Contul Revertbot a fost creat deja cu mult timp în urmă și probabil este ocupat de altcineva, așa că ar trebui ales alt nume (poate PatrulatorBot?).
- Spațiile de nume Categorie, Portal și Modul ar trebui luate și ele în considerare de către robot.
- Orice avertisment acordat de acest robot ar trebui să spună clar utilizatorului avertizat că cel care a judecat editarea este un robot. Pentru editările anulate de robot, dar care au mai puține șanse să fie vandalisme, ar trebui folosit un format special care să spună de ce a fost anulată modificarea (altul decât {{Au-vandalism1}}/{{Au-test1}}). Pe scurt, ar exista două variante de avertizare pentru acest robot: 1. pentru editările care au șanse mari să fie vandalisme {{Au-vandalism1}} cu încă un format care spune că editarea a fost anulată de un robot și ce să facă utilizatorul dacă consideră că editarea sa nu ar trebui anulată și 2. alt format pentru editările care au mai puține șanse să fie vandalisme. --NGC 54 (discuție|contribuții) 15 ianuarie 2022 02:57 (EET)
- Toată ideea robotului este să selecteze doar editările cu șanse foarte mari să fie vandalisme - cele mai rele dintre cele rele. Cred că ar fi mai bine ca în caz de fals-pozitive să procedăm ca la CueBot NG, unde utilizatorii pot să-și șteargă avertizările dacă au reclamat o eroare a robotului. Strainu (دسستي) 15 ianuarie 2022 03:14 (EET)
Am modificat în jos pragul de revert propus până la 0,93. Pentru motive, vedeți secțiunea asta.Strainu (دسستي) 14 ianuarie 2022 00:51 (EET)
- Întrebare: Revertbotul va avertiza utilizatorii ale căror editări au fost anulate? --Pafsanias (discuție) 14 ianuarie 2022 10:52 (EET)
- Bună întrebare ! Teoretic revertul v-a fi semnalat la "Alertele dumneavoastră", dar, cu siguranță ar fi util un text explicativ scurt care să includă un link spre o listă de patrulatori/administratori (de preferință activi în ultima lună, dacă ea poate fi actualizată automat). Scopul ar fi ca editorul să poată apela în mod direct la cineva uman, pentru a-i putea evalua, la nevoie, editarea. Cu această ocazie, va exista în pagină și un fel de format care va avertiza pe oricine consideră că este cazul, că acel cont/IP a făcut în trecut editări potențial cu probleme. În perspectivă, în felul ăsta ar putea poate fi coborât, în viitor și mai jos pragul.--Accipiter Gentilis Q.(D) 14 ianuarie 2022 11:21 (EET)
- Pun un draft de text: Modificarea dv. asupra paginii NumePagină din XX YY ZZZZ aa:bb [dată oră] a fost înlăturată de către un sistem de detecție, analiză și gestiune automată a editărilor, dat fiind că i s-a atribuit un scor de risc nefavorabil. Puteți solicita reanalizarea ei [[Wikipedia:NumeListă|de către un operator uman]] accesând [[link]].--SemnăturăBot--Accipiter Gentilis Q.(D) 14 ianuarie 2022 11:31 (EET) P.S. Eventual, în loc de Modificarea dv. asupra paginii NumePagină din XX YY ZZZZ aa:bb [dată oră] poate fi scris [link diff O modificare recentă a dv.]
- Aici vorbim de cele mai evidente vandalisme, se pot folosi avertizările standard ({{au-vandalism1}}...), plus un alineat suplimentar care să trimită undeva pentru review. Cred că unii colegi sunt interesați ca numărul de pătrățele să fie cel corect. Nu pot garanta acest lucru, sunt prea multe scenarii posibile, dar pot folosi ultimul avertisment din pagină în momentul citirii. Strainu (دسستي) 14 ianuarie 2022 12:08 (EET)
- Personal, mai importantă decât numărul de pătrățele mi se pare evitarea îndepărtării unui potențial contributor pozitiv. Faptul că textul postat netezește calea spre acceptarea revertului ca ceva care nu este non-friendly de către cineva bine intenționat, fie el și 1 din 10 cazuri, mi se pare un lucru important. Oricum o pagină cu multe marcaje de revert automat va fi pagina unui cont sau Ip potențial problematic și nu văd ce trebuie să stau să mai și număr pătrățelele, în acest caz. Bănui că, cel puțin teoretic, poate fi setat botul ca în caz că există un număr mai mare de reverturi decât Y în unitatea de timp X, să pună un flag suplimentar necesitând atenția unui administrator pentru a evalua o potențială blocare, sau, poate fi eventual setat să blocheze temporar Ip-ul/contul pentru 24 de ore și să trimită cazul la evaluarea unui operator uman.Habar nu am dacă e posibil sau nu sau dacă e indicat sau nu. Doar ridic problema la fileu.--Accipiter Gentilis Q.(D) 14 ianuarie 2022 15:08 (EET)
- @Accipiter Gentilis Q.: Ar trebui să fie posibil ca robotul să poată raporta utilizatori, căci la en.wp, ClueBot NG raportează (cel mai recent exemplu). Pentru a putea bloca, ar trebui să fie administrator la fel ca ST47ProxyBot (grupuri | blocări efectuate) de la en.wp. --NGC 54 (discuție|contribuții) 15 ianuarie 2022 03:18 (EET)
- Personal, mai importantă decât numărul de pătrățele mi se pare evitarea îndepărtării unui potențial contributor pozitiv. Faptul că textul postat netezește calea spre acceptarea revertului ca ceva care nu este non-friendly de către cineva bine intenționat, fie el și 1 din 10 cazuri, mi se pare un lucru important. Oricum o pagină cu multe marcaje de revert automat va fi pagina unui cont sau Ip potențial problematic și nu văd ce trebuie să stau să mai și număr pătrățelele, în acest caz. Bănui că, cel puțin teoretic, poate fi setat botul ca în caz că există un număr mai mare de reverturi decât Y în unitatea de timp X, să pună un flag suplimentar necesitând atenția unui administrator pentru a evalua o potențială blocare, sau, poate fi eventual setat să blocheze temporar Ip-ul/contul pentru 24 de ore și să trimită cazul la evaluarea unui operator uman.Habar nu am dacă e posibil sau nu sau dacă e indicat sau nu. Doar ridic problema la fileu.--Accipiter Gentilis Q.(D) 14 ianuarie 2022 15:08 (EET)
- Aici vorbim de cele mai evidente vandalisme, se pot folosi avertizările standard ({{au-vandalism1}}...), plus un alineat suplimentar care să trimită undeva pentru review. Cred că unii colegi sunt interesați ca numărul de pătrățele să fie cel corect. Nu pot garanta acest lucru, sunt prea multe scenarii posibile, dar pot folosi ultimul avertisment din pagină în momentul citirii. Strainu (دسستي) 14 ianuarie 2022 12:08 (EET)
Am făcut un grant request ce acoperă și acest proiect m:Grants:Project/Rapid/Strainu/Enhance and secure the future of Romanian projects' critical infrastructure.--Strainu (دسستي) 4 februarie 2022 14:33 (EET)
Rapoarte de progres
modificare- 2022-03-23
Am rulat azi-noapte o versiune simplificată de robot, care doar printează editările ce depășesc pragul. Citirea din configul de pe wiki merge OK, la fel și API-ul MW și ORES. A devenit evident foarte repede că intervalul de 10s e mult prea mic, mai ales noaptea, așa că am făcut un algoritm în care timpul poate varia între un min și un max, momentan 10s și 60s.
Pașii următori: crearea unui raport de rulare pe wiki, care să fie actualizat zilnic. Mă voi mai juca cu pragul de revert pentru a putea testa diferite funcționalități, dar deocamdată nu voi face reverturi.--Strainu (دسستي) 23 martie 2022 12:39 (EET)
- 2022-03-25
Rapoartele robotului pot fi văzute la Utilizator:PatrocleBot/Rapoarte. Am făcut de asemenea și un revert de probă în articolul Kung Fu. Chiar dacă nu e clar distructiv, eu aș fi făcut revert la acea schimbare. Ce am aflat în urma testelor e că o cerere de 5000 de schimbări recente nepatrulate acoperă ultimele 30 de zile (intervalul maxim în care sunt date). Putem folosi asta pentru a mai curăța din editările nepatrulate.
Următorul pas e modulul de avertizare a utilizatorilor.--Strainu (دسستي) 25 martie 2022 22:27 (EET)
- Fain! Mi se pare o direcție mai eficientă decât cea despre interzicerea contribuțiilor anonime. Poate că se poate jongla un pic diferențiat cu contribuțiile anonime, în sensul unor praguri diferențiate între clasele de contributori (anonimi sau nu, etc....). Oricum Ores poate atribui un scor de risc diferit, cred, dar poate se poate modula și altfel. Nu mă pricep, doar ridic problema la fileu.--Accipiter Gentilis Q.(D) 31 martie 2022 19:01 (EEST)
- De ce considerați aceste două propuneri antagoniste? --Pafsanias (discuție) 31 martie 2022 20:34 (EEST)
- De unde rezultă că le consider astfel? Nu mi se pare că ar avea caracter antagonic. Consider doar că soluția propusă de Strainu are o eficiență superioară și efecte adverse mai mici. --Accipiter Gentilis Q.(D) 31 martie 2022 22:56 (EEST)
- Din mesajul de mai sus și cel de la Cafenea. Dacă nu sunt antagoniste, înseamnă că pot fi implementate în paralel. --Pafsanias (discuție) 31 martie 2022 23:08 (EEST)
- Pot fi, dar rămâne de văzut dacă totalul efectelor adverse ale implementării în paralel, a ambelor inițiative, nu depășește simpla sumă a acestora. Sunt tentat să afirm că totalul ar fi mai mare decât simpla sumă, motiv pentru care am tendința de a fi contra adoptării inițiativei de interzicere a editării de pe IP. Deocamdată însă nu afirm că sunt împotriva inițiativei menționate, ci doar că estimez că va avea efecte adverse mai mari și că, a o combina cu inițiativa lui Strainu are potențialul de genera efecte adverse mai mari, decât simpla sumă generată de adoptarea fiecăreai dintre inițiative, în parte. Rezumând: apreciez ca fiind cea mai eficientă în materie de efecte pozitive și cea mai benignă în materie de efecte negative propunerea lui Strainu și tind să fiu critic în ce privește asocierea celor două inițiative. --Accipiter Gentilis Q.(D) 2 aprilie 2022 12:54 (EEST)
- Nu prea văd cum obligativitatea înregistrării unui cont ar putea potența efectele negative ale prezentei inițiative, dar poate că există estimări statistice și probabiliste pe care nu le cunosc. Ce „efecte adverse” aveți în vedere concret? --Pafsanias (discuție) 4 aprilie 2022 11:42 (EEST)
- Pot fi, dar rămâne de văzut dacă totalul efectelor adverse ale implementării în paralel, a ambelor inițiative, nu depășește simpla sumă a acestora. Sunt tentat să afirm că totalul ar fi mai mare decât simpla sumă, motiv pentru care am tendința de a fi contra adoptării inițiativei de interzicere a editării de pe IP. Deocamdată însă nu afirm că sunt împotriva inițiativei menționate, ci doar că estimez că va avea efecte adverse mai mari și că, a o combina cu inițiativa lui Strainu are potențialul de genera efecte adverse mai mari, decât simpla sumă generată de adoptarea fiecăreai dintre inițiative, în parte. Rezumând: apreciez ca fiind cea mai eficientă în materie de efecte pozitive și cea mai benignă în materie de efecte negative propunerea lui Strainu și tind să fiu critic în ce privește asocierea celor două inițiative. --Accipiter Gentilis Q.(D) 2 aprilie 2022 12:54 (EEST)
- Din mesajul de mai sus și cel de la Cafenea. Dacă nu sunt antagoniste, înseamnă că pot fi implementate în paralel. --Pafsanias (discuție) 31 martie 2022 23:08 (EEST)
- Problema diferențierii între utilizatori e spinoasă. Teoretic ar trebui să dea aceleași rezultate indiferent de utilizator. Practic, e cunoscut faptul că ORES e părtinitor (în sens negativ) față de anonimi, deci o editare similară ar obține un scor mai mare dacă ar fi făcută de un anonim. Nu am studiat suficient modelul încât să explic asta, dar ideea e că o asemenea decizie ar fi doar un gest de bunăvoință față de cei care și-au petrecut timpul cu crearea unui cont.--Strainu (دسستي) 1 aprilie 2022 00:01 (EEST)
- Fain! Mi se pare o direcție mai eficientă decât cea despre interzicerea contribuțiilor anonime. Poate că se poate jongla un pic diferențiat cu contribuțiile anonime, în sensul unor praguri diferențiate între clasele de contributori (anonimi sau nu, etc....). Oricum Ores poate atribui un scor de risc diferit, cred, dar poate se poate modula și altfel. Nu mă pricep, doar ridic problema la fileu.--Accipiter Gentilis Q.(D) 31 martie 2022 19:01 (EEST)
- 2022-03-31
PatrocleBot rulează nesupravegheat! Am pornit o rulare pe toolserver, ceea ce ar trebui să ofere o latență mai mică față de o rulare locală. Este implementat și modulul de avertizare a utilizatorilor, însă mă aștept să mai facă probleme din când în când. Reverturile nu sunt marcate ca fiind făcute de un robot, mesajele și rapoartele însă da. Lăsați-mi un mesaj dacă observați vreo problemă.
Următorul pas este îmbunătățirea codului în așa fel încât să nu crape, orice-ar fi. De asemenea, aș vrea să investighez cât de utilă ar fi parcurgerea tuturor editărilor din SR, nu numai a celor mai recente dintr-un articol. Ideea inițială era că rulând la intervale mici de timp vom prinde toate editările, dar după ce-am implementat acel interval variabil acest lucru nu mai e neapărat adevărat.--Strainu (دسستي) 1 aprilie 2022 00:01 (EEST)
- 2022-04-02
Am coborât temporar pragul la 0,93 pentru a testa mai multe componente din robot. Am reparat componenta de avertizare a utilizatorilor și am făcut să se afișeze datele din raport în fusul orar al site-ului. Din cele 10 reverturi făcute astăzi (cu pragul 0,93 cu care intenționez să îl rulez în final), au fost 2 care erau de fapt corecte și încă una asupra căreia aș fi revenit deși era parțial corectă. Cele două reverturi cu scor peste 0,94 sunt ambele corecte. Acum urmează (sper) o săptămână de rulare neîntreruptă cu pragul la 0,95. E posibil să nu facă nicio revenire, pentru că scorurile astea sunt rare, caz în care îl voi lăsa până la prima revenire.--Strainu (دسستي) 2 aprilie 2022 01:26 (EEST)
- @Strainu: Special:Diff/14864881: Sună mai natural „vandalism la” în loc de „vandalism în” și ar fi putut exista o legătură către Kamienna Góra. Și nu ar trebui adăugat după avertisment un mesaj suplimentar care să specifice faptul că un robot a anulat editarea și a avertizat utilizatorul? Poate ceva în stilul {{SharedIPAdvice}}. Un astfel de mesaj ar fi util în cazul în care editarea era de fapt constructivă; în felul acesta, utilizatorului avertizat îi s-ar da de înțeles că nimeni nu are nimic „personal” cu el. Este doar o sugestie... --NGC 54 (discuție|contribuții) 2 aprilie 2022 03:23 (EEST)
- Yap... Ar fi o bună idee.--Accipiter Gentilis Q.(D) 2 aprilie 2022 08:49 (EEST)
- Am formulat așa pentru că am și un caz de eroare. Când sunt probleme cu obținerea numelui articolului, mesajul va fi "vandalism în Wikipedia". Mă mai gândesc la formulare. Ok pentru legătură și mesajul suplimentar. Strainu (دسستي) 2 aprilie 2022 10:07 (EEST)
- Yap... Ar fi o bună idee.--Accipiter Gentilis Q.(D) 2 aprilie 2022 08:49 (EEST)
- Observ că a mai făcut și Gikü un revert la una din modificările robotului. Eu unul aș fi revenit asupra schimbării, dar e important să notăm cazurile astea pentru a evalua unde trebuie pusă limita. Strainu (دسستي) 2 aprilie 2022 10:52 (EEST)
- 2022-04-06
Am implementat modificările propuse mai sus (exemplu: Discuție_Utilizator:46.97.176.241) și am reluat rularea cu un prag de 0.94. Un lucru interesant observat e că, fiind făcut foarte rapid, vandalii mai revin. Voi pune robotul să urmărească articolele pe care s-a făcut revert și să facă revert la modificările aceluiași user chiar dacă scorul e mai mic decât pragul configurat, dar mai mare decât pragul ORES pentru "foarte probabil cu probleme" (e.g. 0,909<=scor<=0,93)--Strainu (دسستي) 6 aprilie 2022 19:09 (EEST)
- 2022-04-13
Robotul rulează acum în clusterul de Kubernetes al toolforge, cu configurația pe care o propusesem inițial ca finală. Articolele pe care s-a făcut o revenire sunt urmărite timp de 2 ore și se face revert mai agresiv la alte contribuții ale aceluiași utilizator. Pasul următor e să documentez ce face robotul în timp ce el colectează timp de rulare.
Ce am observat urmărind reverturile făcute e că pe măsură ce coborâm scorul analizei (fie pentru revertul inițial, fie pentru etapa de urmărire) devine important și scorul de goodfaith, care indică dacă schimbare a fost problematică intenționat. Mai e nevoie de ceva analiză asupra valorilor, dar ideea e că putem fi mai agresivi dacă și scorul de goodfaith e mic. ← Acest comentariu nesemnat a fost adăugat de Strainu (discuție • contribuții) la 13 aprilie 2022 01:25.
- @Strainu: Nu este posibil ca PatrocleBot să folosească și {{Au-ștergeri1}} etc.? --NGC 54 (discuție|contribuții) 13 aprilie 2022 13:36 (EEST)
- În ce situații credeți că ar trebui folosit acest format? Strainu (دسستي) 13 aprilie 2022 17:27 (EEST)
- @Strainu: De exemplu, PatrocleBot analizează și anulează o editare. Editarea respectivă constă într-o ștergere masivă de text. PatrocleBot acordă vandalului {{Au-ștergeri1}}. Este posibil din punct de vedere tehnic? --NGC 54 (discuție|contribuții) 13 aprilie 2022 21:36 (EEST)
- Orice e posibil tehnic. Partea grea e să definim ce înseamnă ștergere masivă: e un procent, un număr de octeți? Și ce se întâmplă dacă s-au șters și s-au adăugat cantități mari de text în aceeași schimbare, cu diferența rezultată peste pragul decis? Strainu (دسستي) 13 aprilie 2022 22:52 (EEST)
- @Strainu: „Raportați aici.”: Legătura duce către WP:AA. Poate ar trebui înlocuită (nu știu cu ce pagină, poate cu Discuție Utilizator:PatrocleBot, Wikipedia:Cafenea sau o pagină în stilul Wikipedia:Filtrarea modificărilor/Erori?), căci unele discuții se desfășoară la WP:AA tocmai pentru acolo este mai multă „liniște”, spre deosebire de Cafenea, unde șansele ca un troll sau un vandal să intervină sunt mai mari; legătura actuală ar putea duce în viitor la aglomerarea Afișierului. Iar raportările de utilizatori, precum asta, ar trebui făcute la WP:REC. --NGC 54 (discuție|contribuții) 20 aprilie 2022 00:44 (EEST)
- Nu cred că trebuie schimbată destinația. Evaluarea automată funcționează corect, dacă utilizatorul consideră că o modificare nu e vandalism e nevoie de un utilizator cu experiență pentru a evalua editarea respectivă. Nu intenționez să preiau eu acel rol, iar la Cafenea sunt șanse mari ca mesajul să se piardă printre discuțiile de rutină de acolo. În schimb AA e urmărit și de toți patrulatorii, deci e locația perfectă pentru așa ceva. Dacă se va aglomera, ne putem gândi la o pagină dedicată, dar la numărul de reverturi făcute e improbabil.
- O să mut raportările de utilizatori, deși cred că mai util ar fi ca ele să fie făcute fără flag pentru a fi văzute în SR. Strainu (دسستي) 20 aprilie 2022 13:32 (EEST)
- @Strainu: „Raportați aici.”: Legătura duce către WP:AA. Poate ar trebui înlocuită (nu știu cu ce pagină, poate cu Discuție Utilizator:PatrocleBot, Wikipedia:Cafenea sau o pagină în stilul Wikipedia:Filtrarea modificărilor/Erori?), căci unele discuții se desfășoară la WP:AA tocmai pentru acolo este mai multă „liniște”, spre deosebire de Cafenea, unde șansele ca un troll sau un vandal să intervină sunt mai mari; legătura actuală ar putea duce în viitor la aglomerarea Afișierului. Iar raportările de utilizatori, precum asta, ar trebui făcute la WP:REC. --NGC 54 (discuție|contribuții) 20 aprilie 2022 00:44 (EEST)
- Orice e posibil tehnic. Partea grea e să definim ce înseamnă ștergere masivă: e un procent, un număr de octeți? Și ce se întâmplă dacă s-au șters și s-au adăugat cantități mari de text în aceeași schimbare, cu diferența rezultată peste pragul decis? Strainu (دسستي) 13 aprilie 2022 22:52 (EEST)
- @Strainu: De exemplu, PatrocleBot analizează și anulează o editare. Editarea respectivă constă într-o ștergere masivă de text. PatrocleBot acordă vandalului {{Au-ștergeri1}}. Este posibil din punct de vedere tehnic? --NGC 54 (discuție|contribuții) 13 aprilie 2022 21:36 (EEST)
- 2022-05-02
Câteva zile robotul nu a funcționat din cauză că nu mai era logat. Am încercat un fix, sper să fie OK. Am implementat și schimbările discutate mai sus și urmează câteva îmbunătățiri:
- în cazul în care vandalul e singurul autor, revertul eșuează. Va anunța la WP:REC aceste situații.
- voi încerca niște reveniri și pe baza scorului goodfaith (bună credință). Mai întâi dacă și scorul damaging și badfaith (inversul lui goodfaith) sunt în "very likely", apoi mă mai întind și încerc combinații cu un scor likely si celălalt very likely (limitele pot fi găsite în MediaWiki:Revertbot.json)
Din păcate se pare că toate revenirile sunt pe anonimi. Nu e o greșeală, așa sunt scorurile întoarse de ORES, doar 1-2% din toate schimbările "posibil distructive" sunt făcute de utilizatori autentificați. Am logat phab:T307317 pentru asta, să vedem dacă primesc vreo sugestie, însă tare mi-e teamă că e vorba de bias în felul cum am antrenat rețeaua neurală.
Aș vrea să știu și ce părere au patrulatorii despre PatrocleBot până acum? Vă ajută, se simte reducerea numărului de pagini de analizat?--Strainu (دسستي) 2 mai 2022 02:19 (EEST)
- Mie mi se pare că ajută, în mod destul de evident.--Accipiter Gentilis Q.(D) 7 mai 2022 23:40 (EEST)
- 2022-05-04
Am început să revin asupra tuturor modificărilor foarte probabil dăunătoare și foarte probabil de rea credință. E în continuare un număr mic de editări, dar voi mai rafina procesul prin diverse combinații între scorurile ores și perioada de urmărire a utilizatorului și a paginii.
Trebuie investigate mai in detaliu editările de ieri de la Bor (element), pentru că în viitor robotul să poată reveni asupra tuturor acelor editări.
Am observat și o problemă de plasare a mesajelor la reclamații pe care o voi rezolva în următoarea iteratie. Strainu (دسستي) 4 mai 2022 02:28 (EEST)
- 2022-05-07
Astăzi a fost cea mai agitată zi de când am pornit robotul. Partea bună e că a identificat corect ca distructive editările din campania dublajelor, din păcate încă mai erau probleme cu avertismentele. Le-am rezolvat, împreună cu plasarea reclamațiilor unde trebuie.
Trebuie văzut ce putem face cu articolele create de un singur utilizator. Nu le-aș marca cu {{șr}} pentru că articolul ar putea fi salvat. Pe de altă parte, prea multe reclamații vor crea alte probleme. Bănuiesc că și să le las pentru procesul normal de patrulare e o optiune. Păreri aici?--Strainu (دسستي) 7 mai 2022 23:33 (EEST)
- @Strainu: La Utilizator:PatrocleBot/Rapoarte văd „Editări cu probleme neanulate”. De ce există editări pe care PatrocleBot le-a identificat ca fiind cu probleme, dar nu le-a anulat? Aveau un scor ORES mult prea scăzut? Unde pot vedea care sunt acele editări? --NGC 54 (discuție|contribuții) 25 mai 2022 21:23 (EEST)
- Da, acele editări au un scor ORES "damaging" cuprins între 0.909 și 0.93 și un scor "goodfaith" mai mare de 0.07 (vezi MediaWiki:Revertbot.json și raportul de progres din 2 mai). Am experimentat și cu setări mai agresive, dar nu mi-a plăcut rezultatul (vezi mai jos). Având în vedere că toate editările cu scor > 0.93 sunt oricum anulate, cele rămase pot fi găsite la schimbări recente cu filtrele astea: [10]. Strainu (دسستي) 25 mai 2022 21:33 (EEST)
- 2022-05-25
Robotul rulează fără probleme de mai multe săptămâni, făcând revert la 2-3% din totalul editărilor nepatrulate, adică <1% din editările totale (vede cam 400 de editări pe zi, iar media totală fără roboți e de 1500 editări [11]). Din păcate testele făcute arată că o setare mai agresivă pe partea de revert va duce la multe anulări greșite, așa că cel mai potrivit e să lăsăm numerele așa. În schimb, ce putem face este să marcăm ca patrulate schimbările de la capătul celălalt al spectrului de note (foarte probabil bune, foarte probabil bine intenționate).
- 2022-05-26
Patrulări efectuate: [12]--Strainu (دسستي) 26 mai 2022 22:13 (EEST)