Discuție Wikipedia:Sfatul Bătrânilor/Arhiva 148

Umflarea artificială a numărului articolelor

modificare

Vorbesc despre articolele de genul celor din Categorie:Poezii de George Coşbuc și altele asemănătoare (precum Categorie:Operele lui Ion Luca Caragiale). Multe poezii sau alte opere nu au vreo importanță anume. Acum, articolele nu conțin absolut nici un fel de informație și >95% nu vor ajunge niciodată să fie altceva decât un ciot.

De ce se face asta? De ce la ro.wiki ne furăm singuri căciula? Da, fără astfel de articole, am avea mai puține articole decât ungurii, dar ce, e o întrecere? :-)

N-ar fi normal să creezi un articol atunci când chiar vrei să scrii ceva despre subiect? La en.wiki, aceste articole ar fi fost șterse pentru că nu conțin destule informații. Un şcoler emininke 17 iulie 2007 18:40 (EEST)Răspunde

Aţi scris 6 rânduri mai sus, poate dacă scriaţi 3 rânduri la un articol şi 3 la altul ne furam căciula cu 2 articole mai puţin. În rest aceaşi chestiune stăm pe margine, ne punem pe analiză şi pe teoretizare. Că vorbiţi de engleză, pe wp.en când cineva vede o problemă o remediază, la noi când cineva observă o problemă începe să filozofeze. Numai bine.-- Pixi discuţie 17 iulie 2007 18:56 (EEST)Răspunde
Mda...am vrut să pun şi eu problema asta. Am făcut nişte calcule, bazate pe nişte comparaţii între diverse wikipedii. Vedeţi aici. Treaba stă în felul următor:
  • RO.wiki:
    • Articole cu cel puţin 0,5 kB text citibil : 38 %
    • Articole cu cel puţin 2 kB text citibil : 14 %
  • MEDIE.wiki:
    • Articole cu cel puţin 0,5 kB text citibil : 75 %
    • Articole cu cel puţin 2 kB text citibil : 32 %

Concluzie: Procentele RO.wiki vor converge spre valori normale, dacă nu or să apară alte cioturi, cam în momentul în care va avea 160.000 - 180.000 de articole!!. Acuma, sigur vor apărea în continuare un număr de cioturi care nu vor fi completate niciodată, deci, convergenţa va avea loc la valoarea de peste 200.000 de articole.

Ţinând cont de rata de creştere estimată brut din care reiese că ro.wiki (ca şi alte wikipedii de fapt) se dublează în fiecare an, estimez (realist, uşor pesimist) că procentele respective vor fi atinse cam în 3 ani. Vă rog sa mă corectăti dacă greşesc.

P.S. Am observat că în fiecare noapte, sau aproape în fiecare noapte se creeaza cioturi pentru oraşe greceşti... --Bekuletz|Lasă mesaj 17 iulie 2007 19:22 (EEST)Răspunde

Bekuletz, nu se înţelege pe baza cărui criteriu ai extrapolat situaţia curentă ca să ajungi la estimările la care ai ajuns. Dacă toate creşterile păstrează modelul de până acum, nu are importanţă câte articole vor fi, se pot păstra aceleaşi proporţii între cioturi şi articole cu "carne" şi când vom avea 1.000.000 articole. Există vreo tendinţă pe care ai sesizat-o tu analizând evoluţia datelor de-a lungul timpului?
Pixi, sugerezi ca Un şcoler emininke să fi pus mâna să şteargă articolele respective? Sau să le marcheze pentru ştergere rapidă? Sau să le propună pentru ştergere? --Gutza D D+ 17 iulie 2007 20:22 (EEST)Răspunde
Wiki RO EN FR RU ES JA IT DE FI PL UK HU BG EL Media fără RO Media cu RO
% Articole cu cel puţin 0.5 KB text citibil 38 79 81 77 85 68 81 89 78 78 67 78 69 69 76.8 74.0
% Articole cu cel puţin 2 KB text citibil 14 35 30 25 40 19 29 44 25 17 14 34 23 28 27.9 26.9

Datele din tabel sunt conforme cu datele de aici: http://stats.wikimedia.org/RO/ChartsWikipediaRO.htm. Am inclus în tabel unele din cele mai prolifice wikipedii precum şi cîteva din din ţările vecine...reprezentative în spiritul...balcanic ;) (îl citez pe unul din profesorii mei de matematică).

Rata de creştere se poate aproxima de aici (al doilea tabel): http://en.wikipedia.org/wiki/Wikipedia:Multilingual_statistics. M-am mai uitat pe tabel în seara asta şi se pare că am cam supraestimat creşterea de 100%, cred că valoarea de 85% ar fi mai potrivită, sau poate chiar 80% (aş vrea şi părerea voastră). Observaţi că rata de creştere la unele wikipedii mari şi foarte mari începe să scadă la un moment dat(de.wiki 334.000(ian 2006)->520.000(ian 2007) -- +55%), dar sunt si excepţii (pl.wiki 92.000(ian 2006)->212.000(ian 2007) -- +105%). Pentru en.wiki avem: 893.000(ian 2006)->1.560.000(ian 2007) -- +74%. Am luat în considerare nr de articole ian 200x -> ian 200x+1).

Acuma vă explic cum am scos cifrele:

  • RO.wiki are 38% articole cu cel puţin 0.5 kB text citibil din totalul de 69000 -> aproximativ 26200. 69000 - 26200 = 42800 de articole care au sub 0.5 kB text citibil. Aceste 42800 de articole ar trebui să reprezinte, conform tabelului cam 100%-75%=25% dintr-o valoare X. X = 42800*100/25 = 171.200 articole. Ca să corespundă valorile trebuie ca aproximativ 27% din acestea, adică 46000 să aibă peste 2 kB text citibil. Momentan la RO.wiki sunt 14% * 69000 = 9600 de articole care au peste 2kB text citibil. Ţinând cont de faptul că or să mai apară articole mici, trag concluzia că nr total de articole de la RO.wiki trebuie să depăşească bine 200.000 ca să avem procentele corespunzătoare. Luând în calcul rata de creştere şi faptul că în tabelul Articole noi pe zi în luna aceasta de la RO.wiki apar nişte maxime care nu se înscriu în trend (februarie-martie 2006, decembrie 2006-ianuarie 2007), trag concluzia că procentele în cauză vor converge spre valori normale cam în 3 ani.

Concluzie: Ritmul în care se ceează articole de tip ciot ar trebui să fie mai moderat. De exemplu articolele despre diverse oraşe din diverse ţări ale lumii. Din câte îmi aduc aminte o discuţie pe această temă a avut loc deja şi nu vreau să o redeschid.

Raţionamentul meu este într-o formă destul de "brută". Sunt chestii pe care nu le-ma luat în calcul, care influenţează mai ales rata de creştere: popularitatea wikipedia în timp, nr de contribuitori pentru fiecare limbă în parte(m:List_of_Wikipedias_by_language_family, m:List_of_Wikipedias_by_speakers_per_article). Dacă puteţi/vă pricepeţi/aveţi timp vă rog să-l rafinaţi/corectaţi dacă îl consideraţi greşit. --Bekuletz|Lasă mesaj 18 iulie 2007 04:12 (EEST)Răspunde

O întrebare: cum îmi dau seama de dimensiunea unui articol? --R O A M A T A 2007 mesaj 18 iulie 2007 07:47 (EEST)Răspunde
Cred că în privinţa asta atitudinea lui Pixi este cea mai sănătoasă. Putem să facem calcule oricîte vrem, dar indiferent de rezultat realitatea nu se schimbă. Mai bine scriem articole, le corectăm, le completăm, le păzim de vandali, şi atunci se schimbă ceva. Amintiţi-vă de Micul Prinţ şi de afaceristul care-şi număra de zor stelele...
Florin, mărimea în octeţi a unei pagini se afişează în istoricul ei. — AdiJapan  18 iulie 2007 13:30 (EEST)Răspunde
Dacă mă uit mai bine eu am scris aici text cât pentru două articole de 2K+ :). Pentru a avea un reper privind dimensiunea unui articol am făcut un mic test aici: Test dimensiune pagină wiki --Bekuletz|Lasă mesaj 18 iulie 2007 16:19 (EEST)Răspunde
Înapoi la pagina de proiect „Sfatul Bătrânilor/Arhiva 148”.