Discuție Wikipedia:Corectarea diacriticelor

(Redirecționat de la Wikipedia:DCD)
Ultimul comentariu: acum 9 ani de Strainu în subiectul Înlocuire diacritice în editorul vizual

Wikipedia:Corectarea diacriticelor/Resurse

Comandă rapidă:
WP:DCD

Corector diacritice românești

modificare

Tastatura pentru limba română de pe versiunile pre-Vista introduce în mod incorect caracterele Ș și Ț (cu sedilă) în locul celor corecte cu virgulă : Ș și Ț. Din această cauză majoritatea diacriticelor din RoWikipedia sunt cele incorecte, cu sedilă. Pentru detalii vedeți Diacritice, Ș, [1], [2].

Aș dori un bot care să înlocuiască caracterele cu sedilă cu cele cu virgulă în RoWikipedia. Am calificarea profesională să fac așa ceva de unul singur, dar, în condițiile în care nu am făcut nici un bot, iar acest bot ar modifica majoritatea paginilor din RoWikipedia aș prefera să mă asigur că nu fac nici o prostie :).--GringoCroco 5 septembrie 2007 23:59 (EEST)Răspunde

Diacritice ș și ț apar ciudat în versiunile mai vechi ale sistemului Windows (nu fiecare folosește Windows Vista, mulți folosesc WinXP, eu folosesc WinME) și sunt folosite pretutindeni ca suplementele lor. Nu văd sens în aceasta modificare.    Remigiu scrie-mi 6 septembrie 2007 00:05 (EEST)Răspunde
Schimbarea diacriticelor cu cele corecte cu virguliță o avem în vedere. Chestiunea s-a discutat și s-a decis că această schimbare nu este oportună în acest moment. Unul din motive e cel enunțat de Remigiu. Nu mai știu exact pe unde s-a discutat, dar pot să caut. Spor la treabă. --Bekuletz|Lasă mesaj 6 septembrie 2007 00:08 (EEST)Răspunde
Microsoft a actualizat fonturile din Windows Server 2003, Windows Vista și Windows XP Service Pack 2 [3] .--GringoCroco 6 septembrie 2007 00:21 (EEST)Răspunde
Trecerea la forma corectă trebuie efectuată mai devreme sau mai târziu, sperând mai mai devreme decât mai târziu, însă ea nu poate fi efectuată pur și simplu, peste noapte, cu un robot. Trebuie studiate toate efectele negative pe care le poate avea, pentru că poate transforma wikipedia în ceva de necitit. Însă în opinia mea subictul este de actualitate și trebuie implementat treptat, dar sigur. Mai există și alte elemente în arhitectura sitului care necesită "românizare", dar diacriticele sunt cu adevărat un punct sensibil. --—Radufan 6 septembrie 2007 00:47 (EEST)Răspunde
Presupunând că se trece la corectarea diacriticelor, o variantă de rezolvare a problemelor utilizatorilor de sisteme fără suport pentru noul format ar fi să avem un buton în antetul fiecărei pagini din RoWiki care să activeze un mic javascript care să inlocuiască orice apariție a diacriticelor pe bază de virgulă in diacritice cu sedilă.
Pentru a fi siguri că se pastrează integritatea și pentru a asigura funcționarea linkurilor (interwiki sau din exterior către articole RoWiki), pentru fiecare titlu de pagină care are diacritice se va crea o pagină de redirecționare care va utiliza in titlu diacriticele greșite. De ex. pentru București vom crea și pagina București, care va redirecta către prima.--GringoCroco 6 septembrie 2007 01:12 (EEST)Răspunde
E totuși prea devreme... zic eu. Un înlocuitor de diacritice pentru cei care văd pătrățele (ca mine) va încetini navigarea. --Alex:D|Mesaje 6 septembrie 2007 01:36 (EEST)Răspunde

E prea devreme. Deocamdată majoritatea utilizatorilor folosesc încă versiuni de Windows anterioare Vistei (de comparat Categorie:Utilizatori Windows Vista cu Categorie:Utilizatori Windows XP), și o parte dintre ei văd pătrățele în loc de Ș și Ț cu virgulă, ceea ce este mult mai grav decît dacă avem sedile în loc de virgule. Dintre cei care și-au instalat fonturile noi și nu mai au probleme la afișare, cei mai mulți au în schimb probleme la tastatură, fiindcă le lipsesc caracterele cu virgulă. Cred că tranziția trebuie făcută atunci cînd (1) nu mai există probleme cu afișarea și (2) majoritatea contribuitorilor pot scrie cu diacriticele corecte. Probabil va fi nevoie să sondăm periodic situația.

Ar trebui totuși să începem să ne gîndim cum să facem tranziția cît mai puțin dureroasă. Iată cîteva aspecte importante:

  • Funcționalitate. Chestiunea nu este numai de aspect și corectitudine academică, ci mai ales de funcționalitate. De exemplu dacă numele unei imagini conține litera Ș cu sedilă, ea nu poate fi introdusă în articole decît cu această literă.
  • Excepții. Există cîteva situații în care litera Ș corectă este cea cu sedilă, de exemplu în numele de turci sau în articolele care vorbesc tocmai despre aceste diacritice. Litera Ț cu sedilă nu este corectă în nici o limbă, dar se vorbește despre ea la articolul Ț.
  • Ordinea operațiilor. Pentru a evita ca legăturile interne să devină temporar nefuncționale trebuie ca prima operație să fie mutarea articolelor la titlurile cu Ș-uri și Ț-uri corecte (redirecturile se păstrează). Abia apoi trebuie făcută înlocuirea diacriticelor în textul articolelor.
  • După tranziție. Așa cum azi sîntem într-o perioadă de pre-tranziție, cînd se întîmplă ca unii utilizatori să scrie cu caracterele Ș și Ț cu virgulă, tot așa vom avea și o perioadă de post-tranziție, cînd unii vor continua să scrie cu caracterele Ș și Ț cu sedilă (și nu trebuie să-i irităm prea tare!), deci va fi nevoie de un robot care să scaneze în permanență paginile și să corecteze.

Aș dori să-i invit pe cei care se pricep la partea tehnică (la roboți compatibili cu Wikipedia și la modul cum funcționează lucrurile aici) să creeze o pagină separată pentru asemenea discuții. O tranziție prost organizată riscă să provoace pierderi de contribuitori, și nu ne permitem. — AdiJapan  6 septembrie 2007 09:30 (EEST)Răspunde

Sub ce nume o trecem? Wikipedia:Modificare diacritice ?--Strainu 6 septembrie 2007 18:01 (EEST)Răspunde
Ar fi bun un titlu explicit, ca de exemplu „Corectarea diacriticelor românești”. De fapt pagina e destinată numai bucătăriei noastre interne, deci merge orice, numai să ne înțelegem între noi. — AdiJapan  7 septembrie 2007 19:17 (EEST)Răspunde
Propun Wikipedia:Corectarea diacriticelor, „Corectarea diacriticelor românești” e mai explicit, dar conține „ș” și e cam ironic să folosim caracterul greșit în titlul paginii care discută corectarea lui, iar „ș” va apărea ca un pătrățel celor care nu au încă suport pentru forma corectă a diacriticelor.--GringoCroco 7 septembrie 2007 23:04 (EEST)Răspunde
N-am nimic împotrivă. (Am intervenit în mesajul dumneavoastră ca să pun titlul în spațiul de nume potrivit.) — AdiJapan  8 septembrie 2007 17:56 (EEST)Răspunde

Stiri noi

modificare

Iata un mica parte dintr-o discutie de pe grupul traducatorilor romani de Firefox:

„> Tot legat de virgule, stie cineva daca in Vista diacriticele au fost corectate?

Au fost corectate mapările de tastatură și există și fonturi incluse implicit în Vista, și în OS X. Mai rămâne maparea de tastatură pe

Linux (Xorg) pe mai anul ăsta cum mi s-a promis.”

Prin corectate se intelege folosirea virgulei in locul sedilei. Mie asta imi sugereaza ca pana la mijlocul anului vom putea discuta despre trecerea la grafia cu virgula. Pentru a afla insa momentul optim cred ca ar trebui sa aflam ceva date despre sistemele de operare ale vizitatorilor. Stie cineva daca wikimedia pune la dispozitie asemenea statistici si unde pot fi accesate?

Cat priveste trecerea efectiva, eu cred ca am putea introduce in js-ul sitului a unei variante "inversate" de Auto-diacritice, care sa corecteze eventualele scapari ale utilizatorilor. Paginile "sensibile" (vezi discutia de mai sus) ar putea fi catalogate si evitate de script. Ce ziceti?--Strainu (Дйckуцйe) 6 ianuarie 2008 15:47 (EET)Răspunde

Mi se pare prematură discuția. Nu știu dacă Wikipedia are informații statistice despre vizitatori (sper că are, ar trebui să aibă), dar iată cum stau lucrurile în ultima lună pe un site oarecare pe care îl gestionez (audiență internațională):

1. 	Windows	91.91% 	
2. 	Linux 	5.68%
3. 	Macintosh 	2.26%

Iar în cadrul Windows,

1. 	XP 	85.37% 	
2. 	Vista 	11.51%
3. 	2000 	1.36%

De reținut că vorbim de un site oarecum tehnic, cu audiență internațională -- deci este mai probabil ca vizitatorii să aibă sistemele de operare mai actualizate decât în cazul unei audiențe locale fără veleități tehnice. Pentru alt site cu temă non-tehnică și specific românesc pe care-l gestionez, datele stau așa:

1. 	Windows 	99.61% 	
2. 	Linux 	0.39%

Iar în cadrul Windows,

1. 	XP 	92.70% 	
2. 	Vista 	3.75%
3. 	2000	1.58%
4. 	98 	1.18%

Al doilea site are însă audiență relativ mică, așa că datele nu sunt neapărat reprezentative statistic pentru Wikipedia. Însă mi se par totuși grăitoare: penetrarea Vista este pur și simplu prea scăzută ca să discutăm despre migrarea către diacriticele "corecte".

În plus, nu uitați că vorbim despre o problemă absolut minoră pe care n-o sesizează decât persoanele interesate de subiect. Cu alte cuvinte, riscăm să facem conținutul enciclopediei inaccesibil pentru un număr semnificativ de vizitatori cu scopul de a rezolva pentru ceilalți o "problemă" pe care ei nici n-o observă! --Gutza DD+ 6 ianuarie 2008 16:11 (EET)Răspunde

Mda, statisticile mele arata cam la fel. :) Poate am fost prea optimist sa spun jumatatea anului. Oricum, odata ce XP va cobori sub 50% din total cred ca se justifica trecerea. Si nu mi se pare prea devreme sa ne pregatim cu 6 luni inainte, avand in vedere cum se misca treburile pe aici. O sa mai caut statisticile de la wikipedia.--Strainu (Дйckуцйe) 6 ianuarie 2008 17:10 (EET)Răspunde
Te rog recitește ultimul paragraf din răspunsul meu de mai sus: nu sunt deloc de acord că 50% este un prag acceptabil. --Gutza DD+ 6 ianuarie 2008 17:42 (EET)Răspunde
Nu trebuie uitat că dacă pentru utilizatorii de Vista diferența între virgulă și sedilă este pur grafică, minoră și aproape insesiabilă, pentru mulți utilizatori de XP diferența e ca de la cer la pămînt: ei văd pătrățele în loc de litere! Deci tranziția nu se poate face atunci cînd procentul de Vista va trece de 50%, ci atunci cînd numărul celor care văd pătrățele în loc de litere va deveni neglijabil. Mă tem că asta se va întîmpla abia peste un an sau doi, dacă nu mai tîrziu. — AdiJapan  6 ianuarie 2008 18:57 (EET)Răspunde
Exact. Personal estimez 5-10 ani, cu accent spre 10. --Gutza DD+ 6 ianuarie 2008 19:20 (EET)Răspunde
Necazul este că în perioada asta vor fi tot mai mulți contribuitori care scriu că virgule. Bogdan, știu că ai făcut un script pentru ei, va trebui să avem și o pagină cu explicații despre acel script, ca să-i putem îndrepta acolo. Ne trebuie o legătură spre acea pagină pusă la Wikipedia:Diacritice, la secțiunea care vorbește de virgule și sedile. Sau dacă explicația e destul de scurtă poate fi introdusă chiar în acea secțiune. Poate n-ar strica să avem și un robot care să urmărească toate schimbările recente și să convertească virgulele în sedile (dar nu pe loc, ci cu o perioadă de așteptare, să zicem de cîteva ore).
Eu personal pot face tranziția oricînd, înainte și înapoi, de oricîte ori, pentru că folosesc tastatura românească de la secarica.ro și pot alege ce vreau, virgule sau sedile. La fel și cei care folosesc Vista pot comuta ușor. Dar nu putem obliga pe toată lumea să se sincronizeze cu noi. — AdiJapan  6 ianuarie 2008 19:38 (EET)Răspunde
Pentru explicații, vezi WP:DVN. Nu cred că avem nevoie de mai mult pe termen scurt. Pe termen mediu, sunt de acord, va trebui probabil să scriem niște cod care să identifice contribuțiile cu diacritice corecte și fie să le convertească automat, fie să notifice autorul contribuțiilor, îndrumându-l către WP:DVN. --Gutza DD+ 6 ianuarie 2008 19:50 (EET)Răspunde
Nu sunt de acord cu aceasta abordare - consens, consens, dar sa nu generalizam. Daca peste 50% din oameni vad ok pagina, putem incepe sa-i fortam si pe restul. Mai ales ca SP2 e destul de raspandit si din ce scrie la WP:DVN interpreteaza corect diacriticele.--Strainu (Дйckуцйe) 6 ianuarie 2008 20:21 (EET)Răspunde
Să-i forțăm?! Cum propui să faci asta? Nu uita că audiența noastră este formată și din oameni care nu știu să folosească un computer mai mult decât la nivel de Google; studenți care consultă enciclopedia din laboratoare unde este instalat ce este instalat; școli care au resurse limitate. Mi-ar plăcea să cred c-am putea dicta noi ce sisteme de operare să folosească cititorii Wikipedia, dar mi se pare o atitudine nerealistă. --Gutza DD+ 6 ianuarie 2008 20:24 (EET)Răspunde
P.S. În plus, reiterez pentru a treia oară, iar AdiJapan a spus și el asta o dată: propunerea ta este să limităm accesibilitatea unui segment semnificativ din audiență pentru a rezolva o problemă practic insignifiantă pentru marea masă a vizitatorilor. Nu rezolvăm vreo problemă de fond sau una care să aibă vreun fel de nuanță de urgență, ci o chestiune pur cosmetică. Mi se pare un preț uriaș și o propunere complet deplasată să limităm drastic accesibilitatea pentru 50% din audiență pe acest motiv. Dacă-mi scapă ceva, te rog începe prin a clarifica asta, poate de aici provine neînțelegerea. --Gutza DD+ 6 ianuarie 2008 20:37 (EET)Răspunde
Da, iată un motiv pentru care eu iau numai note de 10 la școală: ca să pot să fac un sistem de operare WikipediaOS (și ca să ajung la olimpiadă, evident). -- Petru Dimitriu lasă-mi un mesaj 6 ianuarie 2008 22:25 (EET)Răspunde

Culmea e ca tocmai in discutia din care am citat eu eram ala care sustinea pastrarea sedilelor (in dictionarul din firefox). Se pare ca am judecat cu doua masuri - in mod evident aveti dreptate, e mai important sa propagam informatia la un numar cat mai mare de oameni.

Cred totusi ca schimbarea ar trebui sa aiba loc as soon as possible, iar 10 ani este un termen mult prea pesimist - nu rezista hardwareul atatia ani in conditiile de exploatare din scoli. :P--Strainu (Дйckуцйe) 7 ianuarie 2008 01:41 (EET)Răspunde

Ok, e posibil să fiu și eu excesiv de precaut/conservator/pesimist când spun 10 ani, însă nu e o sentință ci o estimare -- oricum vom face tranziția atunci când vom constata că e momentul s-o facem. Pe de altă parte, ai sesizat bine o problemă mai sus: XP SP2 "vede" corect diacriticele corecte (felul în care le arată este imperfect, dar e doar un detaliu cosmetic, nu o problemă de accesibilitate). Problema constă în identificarea proporției de vizitatori care folosesc SP2: e mult mai ușor de presupus că va penetra XP SP2 relativ curând la nivele acceptabile decât să ne gândim la Vista... Întrebarea e dacă statisticile Wikipedia ne pot ajuta să identificăm aceste proporții. --Gutza DD+ 7 ianuarie 2008 02:07 (EET)Răspunde
Pentru asta putem face un sondaj (iată că totuși sondajele pot folosi la ceva) prin care să estimăm cîți dintre utilizatori văd pătrățele în locul literelor. Eu aș zice că putem face tranziția atunci cînd procentajul lor scade sub aproximativ 5%, cu condiția să avem pregătită o pagină care să explice ce se poate face pentru a vedea corect textul (și să existe o asemenea soluție, aplicabilă de către absolut oricine). Poate că estimarea la 10 ani a lui Gutza e exagerată, dar nu m-aș mira să treacă totuși cîțiva ani pînă să rezolvăm problema. Nu putem face tranziția de dragul corectitudinii formale. Scriem enciclopedia pentru cititori, nu pentru ghicitori.
În cazul meu personal --- Windows XP, SP2, Firefox --- văd literele cu virgulă, inclusiv în caseta de editare, dar mi se afișează cu alt font decît pentru restul textului, ceea ce deranjează un pic. M-am uitat și cu Internet Explorer și situația e albastră: văd pătrățele, cu excepția locurilor unde se forțează alt font cu Format:Unicode, dar atunci afișarea se face cu un font vizibil diferit de restul textului; în caseta de editare văd pătrățele orice-aș face. — AdiJapan  7 ianuarie 2008 11:28 (EET)Răspunde
La sondaje nu participă decât mica fracțiune de utilizatori activi -- iar aici vorbim despre masa incomparabil mai mare a vizitatorilor. Am să încerc să caut niște statistici astăzi. --Gutza DD+ 7 ianuarie 2008 12:58 (EET)Răspunde
Și asta e drept, dar mă gîndeam la un sondaj anunțat prin sitenotice la care să participe orice vizitator. La o adică întregul sondaj se poate organiza direct în sitenotice. Ceva de genul
Cum vedeți literele Ș Ț?
  • Corect.
  • Corect, dar cu alt font.
  • Pătrățele.
Iar cele trei răspunsuri să fie legături prin care se creează noi secțiuni la anumite pagini.
Sigur, dacă există deja statistici pe undeva putem să le folosim. Apropo, la checkuser văd că se înregistrează și informații despre sistemul de operare și browser. Putem cere să ni se facă o statistică? Sau o fi existînd deja? — AdiJapan  7 ianuarie 2008 13:29 (EET)Răspunde
Încă nu am găsit vreo statistică specifică Wikipedia, dar există en:Usage share of desktop operating systems, pagină care se presupune că este actualizată rezonabil de frecvent; în plus, există legături externe interesante. La un moment dat exista en:Wikipedia:Browsers (pagină învechită), ceea ce indică un oarecare nivel de acces la server logs; în pagina de discuții se face referire la o pagină care nu mai există (http://wikimedia.org/stats/en.wikipedia.org/agent_200409.html), ceea ce este probabil să indice o reducere a nivelului de acces la astfel de informații. Mai investighez. --Gutza DD+ 7 ianuarie 2008 14:02 (EET)Răspunde
Am întrebat la Meta. — AdiJapan  7 ianuarie 2008 14:38 (EET)Răspunde
Acum câteva luni, am încercat să folosesc diacriticele corecte pe Instant Messenger cu mai mulți prieteni. Jumătate din ei le vedeau, jumătate nu. E adevărat că în ultimul service pack de la Windows XP sunt incluse, dar la noi sunt destui care nu au windows cu licență și nu-și fac updateurile. Iar unele versiuni de linux (cele mai minimaliste) nu includ fonturile pentru diacritice. (știu că la un moment dat, nici în knoppix nu mergeau) New World Order 7 ianuarie 2008 23:34 (EET)Răspunde

Din cite stiu nu SP2 corecteaza diacriticele in Windows XP ci un update care vine odata cu IE7. IE7 cerea la instalare (update) verificarea licentei sistemului de operare, acum update-ul la IE7 nu mai verifica acest lucru - fn

Ordinea operațiunilor

modificare

Am vorbit și înainte un pic despre ordinea operațiunilor, atunci cînd va veni momentul să facem tranziția (whenever that will be...) și am spus că pentru a evita problemele trebuie procedat în ordinea:

  1. Mai întîi trebuie mutate toate paginile la titlurile cu diacriticele noi, păstrînd neapărat redirecturile rămase.
  2. Abia apoi trebuie modificat textul tuturor articolelor, inclusiv legăturile interne. (Va exista o listă de excepții legate de exemplu de cuvintele în limba turcă.)

Adineauri mi-am dat seama că mai e o chichiță: parametrii formatelor. Unele formate au ca nume de parametru cuvinte care conțin Ș și Ț. Indiferent de ordinea în care modificăm textul paginilor, va exista un interval în care aceste formate (sau anumite părți din ele) vor fi nefuncționale. Pentru a minimiza perioada de nefuncționalitate ar trebui ca imediat după sau imediat înainte de modificarea unui format care conține Ș și Ț în numele parametrilor să modificăm și toate paginile în care este apelat formatul.

Dacă e prea complicat din punct de vedere al programării robotului atunci putem neglija chestiunea asta, dar am estimat că tranziția va dura vreo două săptămîni (cu 5 secunde pe pagină, 270.000 de pagini), deci vom avea nevoie de multă răbdare.

Altă problemă: cînd și cum vom schimba spațiile de nume care conțin Ț-uri? Adică toate paginile de discuții... Ar trebui ca pe perioada tranziției să avem în soft un fel de redirecturi generale de la Ț-ul vechi la Ț-ul nou. Asta nu putem face noi singuri (sau putem, dar e mult de măcinat pentru robot, iar redirecturile respective vor fi de fapt în spațiul articolelor). — AdiJapan  24 ianuarie 2008 07:50 (EET)Răspunde

De ce?

modificare

În ultimii ani s-au făcut o multitudine de dicționare electronice bilingve, în care una din limbi este limba română, precum și multe baze de date folosind ȘȚ (cu sedilă). Cred că ideea de a trece pe varianta cu virgulă a fost decisă de omeni care nu utilizează în mod curent claculatorul, pentru că pe hârtie e totuna dacă literele au virgulă, sedilă, punct sau orice alt guguloi pe dedesubt. Dar trecerea la diacriticele cu virgulă va distruge zeci de mii de ore de muncă, făcând inutilizabile bazele de date (dicționarele) la care s-a muncit în ultimii 15 ani. Așa cum sunt oameni care preferă să rămână la "î" și să nu trecă la "â", de ce trebuie să se facă toată brambureala aceasta cu trecerea la ȘȚ (cu virgulă)? --Miehs (discuție) 13 decembrie 2008 23:41 (EET)Răspunde

Pentru că așa e corect. Dacă vă uitați cu atenție la literele ș și ț cu "sedilă" o să observați că ș chiar are sedilă (este o literă legitimă în turcă) în timp ce ț are de fapt virgulă (litera "t cu sedilă" nu există de fapt în nicio limbă; dat fiind că româna este singura care o folosește în practică, s-a găsit un compromis). Deci deja este o brambureală, soluția de a separa "literă cu sedilă" de "literă cu virgulă" este un pas firesc (în fine, pasul cu adevărat firesc ar fi fost adoptarea variantelor corecte de la bun început, dar e prea târziu să discutăm acum despre asta). Cât despre distrugerea bazelor de date, nu sunt de acord cu dumneavoastră. Dimpotrivă, implementarea soluției corecte va duce la îmbunătățirea bazelor de date, odată ce acestea adoptă standardul corect – va dispărea ambiguitatea dintre literele românești și cele turcești, ceea ce nu poate fi decât un rezultat pozitiv. --Gutza DD+ 13 decembrie 2008 23:51 (EET)Răspunde

ȘȚ

modificare

Iar despre. Sunt unii utilizatori care au MAC și a căror tastatură generează diacriticele românești șțăîâȘȚĂÂÎ. Ș-urile și ț-urile diferă de cele folosite pe ro:wp. Acestea pot fi înlocuite de noi prin funcția de căutare-înlocuire, ceea ce merge într-un articol scris complet de un asemenea utilizator, dar nu-l putem asista la fiecare editare. Știți vreo soluție? --Turbojet 9 februarie 2009 13:15 (EET

Da, sa trecem la diacriticele corecte. --Strainu (دسستي‎)   9 februarie 2009 14:50 (EET)Răspunde
P.S. Pentru cei care nu sunt la curent, exista in dezvoltare un gadget care sa le arate DOAR celor cu windowsuri vechi diacriticele incorecte.--Strainu (دسستي‎)   9 februarie 2009 14:58 (EET)Răspunde
Există deja un gadget care înlocuiește semnele diacritice corecte cu cele legacy, nu trebuie decât să și-l activeze. --Gutza DD+ 9 februarie 2009 15:12 (EET)Răspunde

Cred că problema nu ar trebui pusă la nivel de sistem de operare (fie el MAC, Windows, Linux etc). Părerea mea este că trebuie gândită problema în funcție de navigator. Exemplu concret: eu folosesc o versiune de Windows care nu afișează corect diacriticele cu virgulă, însă folosind ca navigatoare Firefox, IE 7 sau mai nou (eu am varianta IE 8), ori Google Chrome sau Safari nu am nicio problemă în a vedea corect caracterele șțȘȚ. Totul depinde de ce navigator folosește utilizatorul, nu de sistem. În acest caz, dacă vom ajunge la o concluzir, cred că trebuie un gadget care să transforme șțȘȚ în șțȘȚ. Rămâne de văzut.—Sebimesaj 9 februarie 2009 15:45 (EET)Răspunde

Sebi, nu sunt un expert in problema fonturilor, dar din ce-am inteles eu problema apare din cauza ca fonturile nu contin caracterele care trebuie, iar fonturile tin de sistemul de operare. Din cate stiu eu Firefox nu vine cu fonturi noi. Cel mai probabil mai ai inca aplicatii care nu folosesc fonturile corecte, desi ai fonturile care trebuie.
Nu, nu-i chiar așa. Chiar pe siteul de prezentare al Firefox și Internet Explorer se precizează că a fost rezolvată problema diacriticelor „corecte” (a se vedea în josul paginii acesteia).—Sebimesaj 9 februarie 2009 17:30 (EET)Răspunde
În plus, eu nu am instalat acea extensie a Windows XP privitoare la noile fonturi (nu de alta, dar nu pot).—Sebimesaj 9 februarie 2009 17:36 (EET)Răspunde
FOARTE interesant - ai un link in genul aluia si pentru Firefox?--Strainu (دسستي‎)   9 februarie 2009 18:34 (EET)Răspunde
Pe siteul domnului Secărică (pe care îl citează și Microsoft România) găsești aici o notă legată de Mozilla (caută în pagină cuvântul „Mozilla”).—Sebimesaj 9 februarie 2009 19:09 (EET)Răspunde
Gutza, parca la ultima discutie de la Wikipedia:Corectarea diacriticelor cazusem de acord ca asta e doar o solutie temporara, pana cadem de acord ca nu mai are sens sa pastram diacriticele gresite. Daca avem o solutie care sa-i "pacaleasca" pe cei cu XP, n-ar mai avea sens pastrarea. Eu am zis de gadget pentru a permite celor cu XP care stiu sigur ca au ce le trebuie (cazul meu) sa dezactiveze inlocuirea. Bineinteles ca se poate incude direct in js-ul sitului.--Strainu (دسستي‎)   9 februarie 2009 16:43 (EET)Răspunde
Exact, pana cadem de acord ca nu mai are sens sa pastram diacriticele gresite. Nu cred că am ajuns acolo. --Gutza DD+ 9 februarie 2009 16:46 (EET)Răspunde
Pffff... fix d-aia am amintit de gadgetul ala. Ma rog, mai discutam cand o sa fie gata.--Strainu (دسستي‎)   9 februarie 2009 16:48 (EET)Răspunde
Avem un gadget funcțional și a cărui implementare respectă consensul actual. În momentul în care vine cineva cu o întrebare pe care o rezolvă acesta, mi se pare contraproductiv să vii cu soluții care nu reflectă consensul și indică un gadget care încă nu există. --Gutza DD+ 9 februarie 2009 17:01 (EET)Răspunde
Cum rezolva acest gadget problema? Tot trebuie sa fie activat de toti utilizatorii ca sa rezolve problema ridicata de Turbojet, nu?--Strainu (دسستي‎)   9 februarie 2009 17:04 (EET)Răspunde
Da. --Gutza DD+ 9 februarie 2009 18:38 (EET)Răspunde
Și dacă vrei să copiezi text de pe wikipedia să-l folosești altundeva? --Urzică (discuție) 9 februarie 2009 16:31 (EET)Răspunde
Ce se intampla atunci? Pana la urma e o alegere - vrei sa scrii cu diacritice corecte sau nu.--Strainu (دسستي‎)   9 februarie 2009 16:48 (EET)Răspunde
Sorry, nu citisem descrierea modificarilor. Acum am inteles ce voiai sa zici.--Strainu (دسستي‎)   9 februarie 2009 16:57 (EET)Răspunde
Bine, când vă hotărâți să treceți la diacriticele „corecte” să-mi spuneți de unde pot face rost și de corector orografic „corect” :-) --Turbojet 9 februarie 2009 17:16 (EET)Răspunde
Ce intelegeti prin corector ortografic "corect" si pentru ce aplicatie? De exemplu pentru Firefox exista deja dictionare cu diacriticele corecte.--Strainu (دسستي‎)   9 februarie 2009 17:19 (EET)Răspunde
Pt. MS Office 97-2003/WinXP, combinația „standard” a MECI. --Turbojet 9 februarie 2009 17:25 (EET)Răspunde
Cînd vom trece la diacriticele corecte (deocamdată e prea devreme) va exista un gadget similar cu cel de acum, dar invers, adică va converti sedilele în virgule. Deci puteți folosi orice corector extern, inclusiv din cele care merg cu sedile, pentru că atunci cînd aduceți textul corectat și salvați pagina se va face conversia automat în virgule. — AdiJapan 9 februarie 2009 17:34 (EET)Răspunde

Deși într-adevăr putem să trecem la diacritice corecte, este important să planuim acest schimb și să-l împlementăm pas cu pas. Spre exemplu, la începutul un bot redenumește toate paginile care au „ș”/„ț” în titlu - aceasta poate fi dificil, pentru că ș-ul însuși este folosit de câteva limbi din familie turcică, mai ales turca. Un exemplu de articol care nu trebuie mutat este Alașehir. Cu ț-uri problema nu este așa mare ca nicio limbă nu îl folosească pe acest semn și redenumirea articolului poate să fie ușor preventată. Pasul următor ar fi schimbarea diacriticelor în corpul articolului — aici de asemenea ar exista cazuri când „ș”/„ț” trebuie păstrat. Hai să începem întreaga acțiune chiar acum, cu o „campanie publicitară” — la data de zi lună an Wikipedia românofonă va începe să introducă diacriticile corecte Ș și Ț! Sunteți invitat să ne ajutați! sau ceva din genul acesta.

O alta soluție ar fi să instalăm auto-corector care ar schimba diacriticile pe cerere, se procedează asemănator la Wikipedia în limba sârbă: dacă cineva cere să citească în alfabetul latin sau alfabetul chirilic, poate alege varianta preferată prin butoanele situate în partea de sus a paginii.  Remigiu  discută  9 februarie 2009 17:39 (EET)Răspunde

Remigiu, ai dreptate cu ordinea operațiilor (vezi două secțiuni mai sus). Dar e încă prea devreme pentru tranziție. O mulțime de vizitatori încă mai văd pătrățele în loc de literele cu Ș-urile și Ț-urile corecte. Pentru ei textul devine un dezastru, în timp ce dacă păstrăm diacriticele incorecte poate citi toată lumea.
În orice caz, tranziția se va face cu un robot, nu prin chemare la arme. — AdiJapan 9 februarie 2009 17:55 (EET)Răspunde
Nu neapărat Adi. Se poate face și prin intermediul utilizatorilor (chiar și vandalii or să ne poată ajuta) prin implementarea acestui gadget în Js-ul wiki-ului. (Îmi cer scuze că o să se corecteze acum toate diacriticele cu virgulă, dar am auto-diacriticele activate.)  Daniel  Mesaj  9 februarie 2009 22:05 (EET)Răspunde
Daniel, sigur că se poate și prin intermediul utilizatorilor, dar dacă se poate cu un robot, atunci e mai simplu cu un robot. Însă, repet ce au scris AdiJapan și Gutza: e prea devreme pentru tranziție; mai sunt mulți utilizatori care ar vedea pătrățele în loc de diacriticele corecte. Știu că sunt multe soluții pentru ei (Firefox, EU Font Update, Vista, etc), dar nu e cazul să îi forțăm noi să facă asta, trebuie să se întâmple de la sine, pentru că mulți nu au răbdare să facă instalări și ar zice că Wikipedia e "defectă". Răzvan Socol mesaj 9 februarie 2009 22:17 (EET)Răspunde
Apoi ar mai veni și problema paginilor care folosesc diacritice... Aici o să fie o învălmășeală dacă schimbăm... Când unul face pagină cu diacritice „vechi”, când unul face o pagină cu diacritice „noi”.  Daniel  Mesaj  10 februarie 2009 15:26 (EET)Răspunde

Apel la beta-testeri

modificare

Mai exista o solutie. Celor maxim 25% (daca e nevoie va explic de unde am scos numarul) dintre vizitatori care vad inca patratele putem sa le aratam diacriticele incorecte prin javascript.

Am pus la punct un mic script la Utilizator:Strainu/diacritice.js, bazat pe ce a scris Sebi mai sus. As vrea sa va rog pe voi sa il testati - daca aveti WinXP si Internet Explorer 6 sau mai vechi va inlocui toate patratelele cu literele cu sedila, iar daca aveti alta combinatie ar trebui sa vedeti doar diacritice corecte. Cand editati paginile n-ar trebui sa faca niciun fel de inlocuiri.

Daca il testati si observati orice fel de probleme, dezactivati-l (pana nu strica multe pagini) si lasati-mi un mesaj. De asemenea, as aprecia orice fel de idei cu privire la cum sa marcam portiunile de text care NU ar trebui modificate - asta poate fi util si pentru auto-diacritice. Ca sa il folositi, adaugati in monobook.js codul:

document.write("<script type=\"text/javascript\" src=\"/w/index.php?title=Utilizator:Strainu/diacritice.js&action=raw\"></script>");

Puteti testa scriptul aici.Aveti exemple de diacritice cu sedila si cu virgula. Ar trebui ca pentru toata lumea cele 4 linii sa arate la fel.--Strainu (دسستي‎)   9 februarie 2009 22:58 (EET) P.S. Scriptul e bazat pe o idee a lui Alexxed. Multumiri si scuze ca nu am scris asta aseara.--Strainu (دسستي‎)   10 februarie 2009 11:07 (EET)Răspunde

25% mi se pare uriaș pentru a începe un demers de felul acesta. 25% din rezultatele de pe motoarele de căutare nu se vor vedea bine, 25% dintre toate dispozitivele care nu suportă JavaScript nu vor putea citi textul, 25% din utilizatorii care aleg să nu activeze JavaScipt nu vor citi textul. În plus, chiar și pentru cei 25% din target va fi chinuitor, fiindcă trebuie să aștepte încărcarea completă a întregii pagini (cu poze cu tot!) înainte de a putea începe să citească textul. Iar rezultatul net care este, în ultimă instanță? Practic nul -- foarte puțini dintre cei 75% care pot citi în prezent diacriticele corecte vor și scrie folosind diacriticele corecte. Faptul că în Windows XP SP2 pot citi textul cu diacritice corecte nu înseamnă că pot să și scriu cu ele. Eu aș aștepta ca Windows 7 să aibă cota de piață pe care o avea acum câțiva ani Windows XP înainte de a începe să mă gândesc la migrare (fiindcă nu văd sensul unui demers precum cel propus aici în lipsa unui demers paralel către migrare). --Gutza DD+ 9 februarie 2009 23:17 (EET)Răspunde
S-a mai adus în vedere argumentul că se așteaptă o cantitate neglijabilă de oameni ca să se facă mutarea către diacriticele corecte. Dar cantitatea de utilizatori cu Windows Vista, distribuții recente de Linux și OS X nu este neglijabilă. Ei nu pot căuta în pagină (funcția programului de navigare), iar dacă aleg să contribuie vor fi atenționați că au scris cu diacritice cu virgulă. Problema cea mai mare a diacriticelor incorecte este căutarea, nu afișarea care ar fi suportabilă și cu sedile. Nu cred că cere nimeni aici ca informația să ajungă cu pătrățele la utilizatori, însă este și uzabilitatea o chestiune importantă. Este chiar atât de greu să activezi implicit pe Wikipedia română un script care să convertească textele din pagină pentru utilizatorii de alte sisteme de operare decât Windows XP? Deși fiind o chestiune de principiu, ar trebui să fie invers. Adică datele să fie stocate corect și să fie servite incorect doar la cei care nu pot vedea diacriticele corecte. --Alexandru Szasz (discuție) 10 februarie 2009 11:38 (EET)Răspunde
Cota de piata a dispozitivelor fara JS + oamenii care isi dezactiveaza JS este foarte mica. 90% dintre vizitatorii siturilor monitorizate de trafic.ro au JAVA, care nu vine default cu browserul. Si apoi, ai incercat sa vizitezi Wikipedia cu JS dezactivat? Merge ca fulgerul, dar nu ofera decat optiuni minimale. Cat despre migrare, ea se va face relativ usor cu AD inversat. Incarcarea completa a paginii, avand in vedere dimensiunea medie a articolelor de la noi, nu e o problema serioasa.
Daca acest script nu va convine, hai sa implementam solutia de la sarbi, care din ce-am inteles beneficiaza de suport din software. Orice, dar nu sa asteptam inca 10 ani cum propuneai tu in 2008.--Strainu (دسستي‎)   9 februarie 2009 23:32 (EET)Răspunde
Cum spuneam la începutul lui 2008, 5-10 ani era o estimare, nu o sentință – vom aștepta atâta timp cât va fi necesar să așteptăm, indiferent dacă estimarea mea de atunci se va dovedi corectă sau nu. În prezent, puțin peste 20% dintre utilizatori folosesc Vista la nivel mondial – presupun că suntem de acord că România trebuie să fie ceva mai jos. Deci sub 20% 15% pot scrie cu diacriticele corecte, în timp ce peste 25% nu le pot citi nativ (cred că estimarea ta cu 25% este optimistă, dar nu stau să chițibușăresc cifre). În plus, repet ce s-a mai spus de nenumărate ori pe această pagină: sacrificăm utilizabilitatea pentru unii cu scopul de a face o îmbunătățire întru totul minoră pentru alții, mi se pare un compromis de neconceput. --Gutza DD+ 9 februarie 2009 23:43 (EET)Răspunde
Tocmai, ca nu sacrifici NIMIC. Trecerea la diacriticele noi se poate face automat, fara mare stres din partea vizitatorilor, iar cei care vor avea de suferit sunt pana in 2% (am zis 1% dispozitive mobile desi e enorm si 25%*4% care isi dezactiveaza JS) Cei 25% sunt obtinuti astfel: 85% din vizitatori au Windows XP si mai vechi, IE are cota de piata 60%, iar IE6 si mai vechi au 50% din cota de piata a IE (date de pe un sit generalist din romania cu 3000 de vizitatori unici pe zi). --Strainu (دسستي‎)   10 februarie 2009 11:07 (EET)Răspunde

Am propus mai sus o soluție sârbă. Astfel rezultate de căutare vor fi vizibile atât cu diacritice vechi cât și noi. Trebuie să semnalăm undeva la meta, că vrem ceva din genul ăsta să fie împlementat.  Remigiu  discută  9 februarie 2009 23:53 (EET)Răspunde

Dacă aveți plăcere să investiți timp în așa ceva nu mă voi opune. La sârbi bug-ul este aici, cu explicații aici. --Gutza DD+ 9 februarie 2009 23:59 (EET)Răspunde
Mai multe detalii: sunt mai multe limbi cu variante aici, vedeți limbile care au fișiere de dependințe aici (e.g. [4], [5], [6], [7] – dependințele de acolo presupun de regulă necesitatea de a face astfel de conversii server-side). --Gutza DD+ 10 februarie 2009 00:08 (EET)Răspunde
Bine, am cerut. Aștept răspuns, vă voi informa cel mai repede posibil.  Remigiu  discută  10 februarie 2009 00:34 (EET)Răspunde
Ati cerut...unde? Un numar de bug, ceva?--Strainu (دسستي‎)   10 februarie 2009 11:07 (EET)Răspunde
Bug 17428. --Gutza DD+ 10 februarie 2009 11:29 (EET)Răspunde
Mi se pare mai rău să existe vizibil opțiunea de a alege între corect și incorect. Aici nu e un test de gramatică, nu ar trebui să existe posibilitatea de a alege ceva incorect. --Alexandru Szasz (discuție) 10 februarie 2009 11:28 (EET)Răspunde
Legat de scriptul propus aici, cred că conform regulilor actuale Wikipedia în română ar trebui ca nodurile de tip text să folosească funcția badToGood iar cele textarea/input goodToBad.--Alexandru Szasz (discuție) 10 februarie 2009 11:43 (EET)Răspunde

Am o întrebare: dacă o să trecem la diacriticele corecte, ce se va întâmpla atunci când cineva care folosește diacriticele cu sedilă o să creeze un nou articol care conține fie ș sau ț? Se va transforma în ș și ț?—Sebimesaj 10 februarie 2009 14:16 (EET)Răspunde

Și încă ceva: dacă același utilizator va folosi funcția de căutare scriind tot cu aceleași diacritice incorecte va ajunge la articolul la care dorește?—Sebimesaj 10 februarie 2009 14:19 (EET)Răspunde
Nu vom trece la diacriticele noi, cel puțin nu acum. Însă atunci când se va întâmpla, probabil vom avea nevoie de niște cod în Common.js care să facă asta, da. Chiar și așa, tot va fi problematic -- de exemplu se vor crea articole ale căror nume va conține diacritice greșite (așa cum se întâmplă și acum ocazional cu diacriticele corecte). Va fi o perioadă de tranziție foarte dificilă, și cu atât mai dificilă cu cât numărul de persoane care scriu cu diacritice vechi este mai mare. Funcția de căutare cred că suportă deja orice fel de diacritice. --Gutza DD+ 10 februarie 2009 14:22 (EET)Răspunde
Da (cu un auto-diacritice inversat) si da (metoda ramane de ales). Nu vor fi problemele pe care le expune Gutza daca se implementeaza auto-diacritice pentru toti utilizatorii. Apropo, de ce esti asa de sigur ca nu vom trece acum? Lasa si restul lumii sa-si exprime pozitia, nu trage concluzii grabite.--Strainu (دسستي‎)   10 februarie 2009 14:24 (EET)Răspunde
Strainu, trecerea la diacriticele corecte trebuie făcută atunci cînd proporția celor care văd pătrățele devine neglijabilă, iar prin asta înțeleg ceva de ordinul a 1%. Nu uita ce punem în balanță: ca unii să vadă Ș-urile cu un alt semn diacritic (la limita perceptibilului) și ca alții să vadă puzderie de pătrățele în articole. Cele două neajunsuri au evident greutăți total diferite, deci trecerea nu se poate face cînd cititorii vor fi jumi-juma. De fapt care e graba? — AdiJapan 10 februarie 2009 14:48 (EET)Răspunde
Adi, am mai zis mai sus. Cei care au Linux, Windows Vista sau OS X nu sunt 1% și nu trebuie neglijați la fel cum nu trebuie neglijați nici cei cu Windows XP. Primii amintiți caută cu virgule și nu vor „sălta” la un articol precum Timișoara. Nu e vorba numai de purism aici. Drăcia asta de script „Diacritice corecte” trebuie să fie o soluție pentru ei atât vizibil cât și din punct de vedere al funcționării --Alexandru Szasz (discuție) 10 februarie 2009 23:57 (EET)Răspunde
Strainu, începe să devină supărătoare tendința ta de a închide gura celor care nu sunt de acord cu tine pe motiv că nu și-a exprimat toată lumea opinia. De mai bine de un an pledezi pentru adoptarea prematură a acestui standard; de-a lungul timpului ai întâmpinat rezistență susținută din partea unei părți cel puțin semnificative a celor care și-au exprimat opinia, iar motivele sunt absolut evidente. Sub nicio formă nu se poate pretinde că am ajuns sau am putea ajunge la vreo formă de consens în privința migrării pe termen scurt, iar asta e la fel de evident din discuția curentă pe cât a fost de evident și din discuțiile anterioare. Personal aș putea fi de acord cu implementarea poveștii cu LanguageRo.php șamd dar numai ca un gadget cosmetic -- în baza de date vom rămâne cu diacriticele vechi, iar forma implicită de afișare va fi oricum cea curentă. De altfel, îmi dau acum seama că toată funcționalitatea de acolo poate fi emulată cu un JavaScript în genul celui pe care l-ai propus, însă care să facă exclusiv transformarea în diacritice noi de dragul vizualizării, script care ar fi activat pe bază voluntară. Poate ar fi util să scrii un astfel de gadget și să vedem care e nivelul de interes pentru el -- ar putea fi reprezentativ pentru nivelul de interes legat de tranziție. --Gutza DD+ 10 februarie 2009 15:00 (EET)Răspunde
Rezistenta de acum un an avea la baza unele argumente care pur si simplu nu mai sunt valabile - procentul celor care vad patratele a fost practic impartit la 3 in urma a ceea ce a zis Sebi, si care erau noutati pentru mine. In plus, am oferit o solutie tehnica fezabila si pentru acestia.
Adi, eu tocmai asta explic, cu codul ala javascript procentul celor care vor vedea patratele va fi egal cu procentul celor care nu au JS activat SI au un sistem de operare + browser incompatibile. Iar acest procent este sigur cu o cifra, foarte probabil apropiat de ce zici tu. Graba tine de faptul ca este penibil sa spunem ca facem o enciclopedie in limba romana si sa scriem cu carectere din alte limbi.--Strainu (دسستي‎)   10 februarie 2009 15:24 (EET)Răspunde

In fine, nu vreau sa mai reproduc discutiile fara sfarsit de la Administratori. Daca mariile voastre sunteti anti-tehnologie, aia e. O sa transform codul intr-unul utilizabil intr-un gadget si voi mai reveni peste 6 luni sau 1 an, cand va scadea si mai mult procentul celor cu probleme.--Strainu (دسستي‎)   10 februarie 2009 15:58 (EET)Răspunde

Dacă suntem atât de depășiți de timpuri, poate ne arăți tu un site major de limbă română care folosește diacriticele corecte; sigur sunt alții mai deschiși la minte decât troglodiții de pe-aici. Ți-aș putea răspunde cu aceeași monedă spunând că există doar câțiva căpoși fanatici cu tehnologia și rupți de realitate, însă nu văd în ce fel ironiile ne-ar putea ajuta să ajungem la o concluzie. Fapt este că în acest moment comunitatea nu ar genera conținut folosind diacriticele corecte; orice paleative cosmetice am implementa de dragul celor câțiva care țin să vadă virgule în loc de sedile, încă nu ne putem atinge de baza de date și de felul în care se afișează site-ul în mod implicit. Nu revin cu argumentele pe care le-am prezentat deja mai sus. --Gutza DD+ 10 februarie 2009 16:53 (EET)Răspunde
Dacă companii precum Microsoft se pot deranja să-și modifice saitul cu diacriticele corecte și să pună pe prima pagină a saitului o legătură către un articol în care chiar explică problema diacriticelor, pot și cei mai liberi dintre noi să facă tot ce pot pentru a împăca pe toți.--Alexandru Szasz (discuție) 10 februarie 2009 23:57 (EET)Răspunde
Am mai explicat asta pe undeva: Microsoft are tot interesul să promoveze ultimele noutăți din Windows Vista; noi dimpotrivă, dorim ca enciclopedia să fie cât mai accesibilă indiferent de momentul în care s-a trezit Microsoft la realitate. Uitați-vă mai degrabă la site-uri serioase care nu tratează în particular această problemă: http://www.romanialibera.ro/ nu se deranjează nici măcar să folosească diacritice; http://www.catavencu.ro/ scrie cu diacritice vechi; la fel http://www.acad.ro/, http://www.gov.ro/ și practic toate site-urile mainstream din România (acelea care își dau osteneala să folosească diacritice de fel).
În altă ordine de idei, mă necăjește să constat că persoanele care susțin o poziție conservatoare sunt văzute drept dinozauri sau închiși la minte (nu văd alte poziții antitetice presupusei libertăți și deschideri pe care v-o arogați). Mi se pare de-a dreptul ironic să vă autocatalogați drept liberi și deschiși în condițiile în care propunerea dumneavoastră este de natură să închidă și să limiteze accesul publicului la conținutul enciclopediei. Revin explicit cu precizarea că nu am (și nimeni nu cred că are) ceva împotriva unei soluții cu activare voluntară, precum gadget-ul pe care l-a scris Strainu -- sunteți liber să consultați Wikipedia cu diacritice corecte dacă doriți asta. Însă de aici și până la a impune o tehnologie în mod prematur este o distanță deloc neglijabilă. --Gutza DD+ 11 februarie 2009 00:19 (EET)Răspunde

Codul este acum gata sa fie facut gadget. As ruga in mod cat se poate de politicos si fara ironii pe unul din stimabilii administratori care se pricep sa ne faca si noua, caposilor fanatici cu tehnologia si rupti de realitate un favor si sa ne creeze acest gadget. Daca se poate, sub numele "Diacritice corecte". Multumesc.--Strainu (دسستي‎)   10 februarie 2009 19:12 (EET)Răspunde

Am să-l fac eu mai pe seară. Să-mi spui unde este -- tot cel de la începutul secțiunii? --Gutza DD+ 10 februarie 2009 19:35 (EET)Răspunde
Da.--Strainu (دسستي‎)   10 februarie 2009 20:19 (EET)Răspunde
Gata. A trebuit să fac niște corecturi și în ăsta și în quick-insert, însă merge. --Gutza DD+ 10 februarie 2009 21:08 (EET)Răspunde
Și care-l folosim până la urmă?  Daniel  Mesaj  10 februarie 2009 22:23 (EET)Răspunde
A explicat Strainu la Wikipedia:Diacritice: dacă în mod normal scrii cu diacritice corecte, activezi Auto-diacritice. Independent de asta, dacă vrei să vezi diacriticele corecte, activezi Diacritice-corecte. Sunt independente și pot fi activate simultan -- prima este exclusiv pentru introducere de text, a doua exclusiv pentru vizualizare. --Gutza DD+ 10 februarie 2009 22:31 (EET)Răspunde

Gadgetul „Diacritice corecte”

modificare

Mi l-am activat și merge foarte bine (deși constat că apare o mică întîrziere între afișarea paginii și reafișarea ei cu diacriticele corecte). Dar necazul este că se convertesc toate ș-urile, inclusiv acolo unde nu trebuie. Cum rezolvăm problema?

Știu că am văzut undeva un tag care marchează fragmentele de text scrise într-o anumită limbă. Nu reușesc să găsesc acum, dar era ceva de forma <span lang="fr">merci</span>. Dacă nu mă înșel rostul lor era, printre altele, să oprească intervenția roboților care vînează greșeli de ortografie. Presupun că se poate face la fel și aici, pentru limba turcă. Dar soluția asta n-ar merge și la titlurile paginilor, ca de exemplu Yașar Kemal. Soluții? — AdiJapan 11 februarie 2009 07:36 (EET)Răspunde

Marcajul se face într-un format, ca a fost făcut aici, la sârbi.  Remigiu  discută  11 februarie 2009 14:08 (EET)Răspunde
Ala e un format vizibil, noi am prefera ceva invizibil pentru utilizator.--Strainu (دسستي‎11 februarie 2009 15:08 (EET)Răspunde
Din pacate performanta lasa inca de dorit, da. O sa mai caut solutii - eventual sa renunt la modificarea intregii pagini si sa ma limitez la modificarea articolului.
Asta cu span e o idee foarte buna. Eu ma gandisem la nowiki, dar era util doar pentru AD, nu si pentru diacritice corecte. La titlu n-am nicio idee fara informatii suplimentare din Wiki, nu poti determina limba in timp real decat poate pe baza unui dictionar, dar asta ar afecta si mai mult performanta. O solutie ar fi ca variabila wgContentLanguage, exportata de MediaWiki, sa aiba o alta valoare decat ro pentru articolele cu titlul scris dupa regulile altei limbi.--Strainu (دسستي‎11 februarie 2009 10:47 (EET)Răspunde
Pentru titluri, dacă punem în pagină un format de genul {{limbă titlu|tr}} este posibil ca gadgetul să înțeleagă că nu trebuie convertite ș-urile din titlu?
Tot apropo de gadget: le recomand celor care îl folosesc să-și activeze simultan și AD-ul, pentru că altfel de cîte ori citezi ceva din ro.wp există riscul să aduci ș-uri și ț-uri cu virgulă. De exemplu cînd vorbești despre o pagină de discuție legăturile devin nefuncționale. — AdiJapan 11 februarie 2009 11:09 (EET)Răspunde
(ce) Într-adevăr, foarte bună observația cu SPAN. $wgContentLanguage cred că este limba întrebii pagini, nu cred că e bine să folosim asta pentru a specifica în ce limbă e scris titlul. Pentru asta aș folosi mai degrabă un format invizibil, în genul en:Template:Lowercase (folosit de exemplu în en:eBay); la rândul lui acesta folosește cuvântul magic DISPLAYTITLE. --Gutza DD+ 11 februarie 2009 11:13 (EET)Răspunde
Din păcate DISPLAYTITLE nu oferă aproape nici o libertate. Tot ce poți să faci este să forțezi inițiala minusculă și underscore în loc de spațiu. — AdiJapan 11 februarie 2009 11:24 (EET)Răspunde
Oameni buni, tineti cont ca eu lucrez strict cu HTML. Transformarile efectuate pe codul mediawiki nu ajuta cu nimic. Deci DISPLAYTITLE nu e o solutie. Un format ar putea fi o solutie, dar penalizarea ar fi tot de performanta.--Strainu (دسستي‎11 februarie 2009 11:35 (EET)Răspunde
(ce) [AdiJapan] Hmm, da, ai dreptate. Atunci folosim aceeași convenție dar fără DISPLAYTITLE, în genul chestiei pe care ai sugerat-o și tu. Formatul invizibil {{limbă titlu}} ar conține ceva de genul <span id='title_language'><span lang='tr'></span></span>. Rezultatul este invizibil și poate fi procesat ușor din JavaScript. --Gutza DD+ 11 februarie 2009 11:41 (EET)Răspunde
Bun, deci tehnic e posibil. Mai rămîne să stabilim dacă asta e convenția cea mai convenabilă (atît în text cît și în titlu) și apoi să facem manual modificările respective.
În teorie mișculația asta ar fi necesară doar pe perioada tranziției, iar apoi tagurile se pot șterge. Dar după cum arată lucrurile tranziția va dura mulți ani, pînă vor dispărea și ultimii contribuitori care folosesc diacriticele incorecte. Asta chiar dacă modificarea propriu-zisă a bazei de date se poate face cu un robot într-o zi sau două (sau și mai repede dacă putem obține să se facă conversia nu prin internet, ci cu un roboțel care să ronțăie local în serverele Wikimedia.) — AdiJapan 11 februarie 2009 12:00 (EET)Răspunde

(←) Pentru text nu am nicio îndoială că soluția pe care ai propus-o este cea mai potrivită -- nu numai că este convenabilă, dar respectă și standardele. Pentru titlu soluția la care am ajuns este fără îndoială un artificiu, dar nu cred că putem găsi una semnificativ mai bună. Mi-am dat totuși seama că m-am complicat, ar fi echivalent un singur SPAN gol care să conțină ambele proprietăți: <span id='title_language' lang='tr'></span>. Strainu, cred că este un compromis rezonabil, inclusiv din punctul de vedere al performanței, nu? --Gutza DD+ 11 februarie 2009 12:12 (EET)Răspunde

Nu ma pronunt pana nu fac varianta asta sa mearga decent pe calculatorul meu. Incercati si voi sa modificati articolul Șaibă si ziceti-mi daca pare ca se blocheaza browserul. Mie asa imi pare.--Strainu (دسستي‎11 februarie 2009 15:08 (EET)Răspunde
N-am avut nicio problemă. --Gutza DD+ 11 februarie 2009 15:19 (EET)Răspunde
Nici eu.—Sebimesaj 11 februarie 2009 15:48 (EET)Răspunde

Mi-am dat seama că soluția noastră pentru titluri este totuși prea limitativă. Dacă de exemplu avem un titlu de forma „Yașar Kemal‎ la București” nu putem formaliza corect diacriticele cu un singur tag. Aș propune să schimbăm {{limbă titlu}} cu {{titlu corect|<span lang='tr'>Yaşar Kemal‎</span> la București}}; formatul ar produce ceva de forma <span id='full_title' style='display:none'><span lang='tr'>Yaşar Kemal‎</span> la București</span>. Merge și este invizibil. --Gutza DD+ 11 februarie 2009 21:07 (EET)Răspunde

Am creat formatul și am făcut modificările de rigoare în Yașar Kemal. Din păcate formatul este un pic mai greoi fiindcă necesită specificarea explicită a parametrului, din cauza semnelor „=” de prin conținut (i.e. {{titlu corect|1=<span lang='tr'>Yaşar Kemal‎</span>}}), însă este o formă completă, corectă și consecventă de a specifica titlul. --Gutza DD+ 11 februarie 2009 21:27 (EET)Răspunde

Caractere corecte și anunț

modificare

Eu zic să prezentăm tot timpul caracterele corecte și o bandă micuță în partea de sus a fiecărui articol prin care îi sugerăm utilizatorului ca în cazul în care nu vede caracterele corecte să descarce actualizarea de la Microsoft care rezolvă problema (cu legătură cu tot). Nu are rost să continuăm să încurajăm caracterele greșite. Windows XP are deja 8 ani și de la apariția lui au fost lansate încă două versiuni de Windows. Manuel R. Ciosici--Manuelciosici (discuție) 17 februarie 2010 11:10 (EET)Răspunde

Eu sunt de acord cu această propunere. Deja majoritatea ar trebui să poată vedea caracterele corecte, mai ales că Windows XP a primit o actualizare automată în acest sens. Nu este posibil cumva să implementăm o soluție tehnică care să convertească automat caracterele cu sedilă în cele cu virgulă atunci când utilizatorul face clic pe butonul Salvează pagina? Pentru că ăsta ar fi ultimul impediment pe care l-am avea înainte de a schimba toate caracterele cu sedilă în cele cu viruglă. Ar mai fi și redirecționările de la vechiul titlu către noul titlu, așa încât să nu existe probleme cu linkurile din motoarele de căutare (până ce Google, Yahoo și restul vor indexa noile linkuri). În rest cred că sunt foarte foarte puțini care mai văd pătrățele (am putea folosi pentru aceștia soluția propusă de antevorbitorul meu), iar din punctul de vedere al termenilor de căutare se pare că atât Wikipedia, cât și Google confundă s-sedilă cu s-virgulă (deci nu ar trebui să fie nicio problemă). Mișcarea ar trebui să se facă în același timp cu trecerea la â din a, dat fiind că deja de mult timp, Academia de Științe a Moldovei a recomandat trecerea la noile reguli. --Danutz (discuție) 19 februarie 2010 19:59 (EET)Răspunde
În primul și în primul rând trebuie verificat în mod explicit dacă o mașină cu Windows XP pe care s-au instalat exclusiv actualizările automate poate afișa într-adevăr caracterele corecte. Se întâmplă că am o astfel de mașină, am să verific asta în cursul săptămânii viitoare.
Dacă această verificare duce la rezultate pozitive trebuie discutat cum să facem tranziția. Unealtă care să convertească automat de la sedile la virgule se poate face extrem de ușor (este fix inversul uneltei Wikipedia:Unelte/Auto-diacritice, nu trebuie decât inversate câteva caractere și instalat codul rezultat în common.js). Dar asta nu înseamnă nici pe departe că problema este rezolvată:
  • Cea mai mare problemă ca magnitudine sunt spațiile de nume care conțin diacritice cu sedile. Adică tot ce înseamnă Discuție, Discuție Wikipedia șamd. Dacă se implementează unealta de mai sus fără să se adreseze problema spațiilor de nume vor rezulta legături către pagini care nu există.
  • Cea mai mare problemă ca impact asupra cititorilor sunt titlurile de articol care conțin aceleași diacritice. De pildă dacă eu scriu aici [[Pitești]] iar unealta automată convertește litera ș la varianta cu virgulă, rezultatul va fi o legătură roșie.
  • O altă problemă, dar care teoretic ar putea fi ameliorată cu un pic de inteligență în unealta automată de conversie, sunt legăturile interwiki – litera ș (cu sedilă) este folosită și în limba turcă, deci orice unealtă automată trebuie să știe că nu trebuie să se atingă de legăturile interwiki.
Cu siguranță vor mai apărea și alte probleme pe care nu le vom fi prevăzut, însă din exemplele de mai sus se vede clar că această migrație trebuie chibzuită cu mare atenție înainte de a începe în mod efectiv să facem ceva.
Personal aș prefera să nu discutăm grafia cu â în această secțiune -- e un subiect aparte și poate genera discuții care ar strica firul discuției despre migrația de la sedile la virgule. --Gutza DD+ 19 februarie 2010 20:54 (EET)Răspunde
Fostul meu laptop avea doar acea actualizare instalată și vedeam actualizările. O verificare în plus nu strică însă.
  • Știu că MediaWiki poate interpreta și echivalentul englez al spațiilor de nume. Oare nu se pot face și "aliasuri"? Mă voi interesa...
  • Un robot va rezolva problema în sub o săptămână prin crearea de redirectări (vezi și modifcările lui Rebel din septembrie 2009, când practic a dublat numărul de redirectări).
  • Pentru interviki se rezolvă, pentru articolele noastre există deja cod scris în gadgetul de corectare a diacriticelor.
Eu zic că punem un mesaj și la cafenea în așa fel încât să vină cât mai mulți oameni cu idei despr eproblemele care ar putea apare. În ceea ce privește â/î, și eu zic să menținem discuția separată. Până la urmă, aia e ceva mai ușor de implementat.
Apropo, din câte știu eu, WinXP+IE7 afișează corect diacriticele. Este adevărat? Dacă da, probabil numai vreo 5% 7% dintre oameni sunt în situația asta (bazat pe date din nov 09 - (NT<5.2)xIE6)--Strainu (دسستي‎20 februarie 2010 12:52 (EET)Răspunde
Update: Exista aliasuri pentru namespace: http://www.mediawiki.org/wiki/Manual:$wgNamespaceAliases--Strainu (دسستي‎20 februarie 2010 13:03 (EET)Răspunde

Și eu pot confirma că actualizarea de fonturi europene pentru caracterele românești și bulgărești funcționează pe XP (am observat modificări de aspect în afișarea fonturilor).

Da, Windows XP rulând Internet Explorer 7 sau 8 ori Mozilla Firefox 2+ sau Safari, Google Chrome ori Opera afișează (practic, în cazul în care apar „s” și „t” cu virgulă schimbă fontul — ceea ce, la mărimi mari, face observabilă diferența dintre caractere, ele nemaifiind la fel) corect literele în cauză.Sebimesaj 20 februarie 2010 15:09 (EET)Răspunde

Corect, ăsta e comportamentul cu WinXP SP2, iar SP2 este instalat automat via Windows Updates. Speram să fi pus și pachetul ăla pentru Eastern Europe în update-urile automate, dar sunt slabe speranțe... --Gutza DD+ 20 februarie 2010 15:11 (EET)Răspunde

Eu zic să facem primul pas prin crearea de aliasuri la spațiile de nume. În acest fel va fi ușurată sarcina celor cu Windows 7 când se editează secțiuni (apropo, de ce AD nu merge când se editează secțiuni?)--Strainu (دسستي‎20 februarie 2010 16:28 (EET)Răspunde

Discuția despre unealta Auto-diacritice a fost mutată la Discuție Wikipedia:Unelte/Scripturi/Auto-diacritice#Bug.
Strainu, te rog explică acolo ce voiai să spui mai sus despre AD, nici eu n-am înțeles... --Gutza DD+ 21 februarie 2010 21:50 (EET)Răspunde

Iar o luăm de la capăt cu diacriticile? Eu folosesc XP și nu am de gând să fac vreun update. Nu am nimic împotriva diacriticilor corecte, dar browserul meu IE6 întâmpină dificultăți mari la vizualizarea acestor caractere. Abia cu AD-ul lui Gutza reușesc să le văd și eu. Eu înțeleg că mi se sugerează ori să-mi schimb programele, ori să migrez pe enWiki sau la Enciclopedia României unde nu sunt atâta restricții. --Cezarika1 22 februarie 2010 11:48 (EET)Răspunde

Ai vreun motiv special pentru care nu dorești să-ți actualizezi măcar browserul, dacă fonturile nu vrei? Poți găsi Installerul de IE7/IE8 și fără să te întrebe de "Genuine Windows".--Strainu (دسستي‎22 februarie 2010 13:33 (EET)Răspunde
Nu trebuie decât să-ți actualizezi fonturile, lucru pe care oricum *trebuie* să-l faci pentru că încet încet, fără să-și dea seama, saiturile vor trece la diacritice corecte din cauza răspândirii Windows 7 și Vista, deci vor fi mai multe saituri unde nu vei vedea caractere. Actualizarea de fonturi doar adaugă caracterele lipsă la fonturi, nu modifică nimic, să nu o instalezi e doar rea voință. Se poate descărca de aici: [[8]] (E o arhivă care se extrage automat, nu e nevoie de validarea copiei de Windows din nou) --Alexandru Szasz (discuție) 22 februarie 2010 14:35 (EET)Răspunde

Pentru că nu influențează în niciun fel situația existentă, am cerut crearea unor aliasuri pentru namespaceurile cu diacritice (problema 3) în bugzilla:22616. Sper să nu se cramponeze de chestia cu modificarea traducerii pe translatewiki.net înainte de a face modificarea, pentru că în mod clar e o idee proastă.

Cu ocazia asta am găsit o a patra problemă care trebuie luată în calcul: trebuie modificate toate traducerile de la translatewiki.net. Dacă vom continua cu această idee, putem lua legătura cu siebrand pentru a analiza folosirea unui robot și pentru aceste modificări.--Strainu (دسستي‎22 februarie 2010 23:08 (EET)Răspunde

Ca să nu ziceți că am reavoință, am instalat IE8. Prima mea părere este ca și cu continuările filmelor de succes, este o modificare făcută doar ca să vină cu ceva nou (și ca să ia programatorii niște prime grase). Interfața este proastă și nu cred că este vorba doar de obișnuință. Decât așa, mai degrabă lucrez cu Firefox-ul. Plus că după instalare, paginile au început să se descarce mai greu. Ceva soluții pentru a elimina această lentoare? Strainule, dă-mi sugestii, că tu ai venit cu ideea. --Cezarika1 23 februarie 2010 07:19 (EET)Răspunde

Și încă ceva. O particularitate a lucrului cu IE8 în Wikipedia. La IE6, când corectam ceva în mijlocul unei pagini, textul apărea scris unde l-am așezat eu. La IE8, scriu ceva la mijlocul paginii și când apăs Enter, îmi împuinge automat textul în josul casetei. Începe să devină obositor. IE8 nu ajută la lucrul cu textul, ci mai mult încurcă. Un alt lucru care deranjează, este poziționarea butoanelor (spre exemplu cele de înainte-înapoi se află mai sus și sub ele eu am un x și dacă sunt neatent în loc să apăs înapoi, pot să dezactivez o opțiune - e vorba de Yahoo Toolbar). Mai are și altcineva și alte idei la fel de excepționale, pentru a ne da cu testa în c....? --Cezarika1 23 februarie 2010 08:30 (EET)Răspunde

Când apăs blank, pe lângă efectul dorit, paragraful este împins cu un rând mai jos în casetă. Nu știu dacă m-am făcut înțeles, dar IE8 este mai dăunător Wikipediei decât IE6. --Cezarika1 23 februarie 2010 08:45 (EET)Răspunde

Am testat și Firefox-ul. Merge mai bine, dar consumă mai multe resurse, iar paginile mi se blochează. Ceva sugestii? --Cezarika1 23 februarie 2010 09:52 (EET)Răspunde

Îți răspund în pagina de discuții--Strainu (دسستي‎23 februarie 2010 18:12 (EET)Răspunde
Văd că au început pregătiri ceva mai concrete pentru migrarea la diacriticele corecte. Dar chiar este oportun? A verificat cineva cam cîți cititori ar avea de suferit? Aici nu e suficient ca majoritatea să vadă bine caracterele, cum spune Danutz, ci trebuie ca numărul celor care nu le văd să fie neglijabil. Singurul avantaj al migrării este alinierea la standard, dar pentru imensa majoritate a cititorilor nu e decît o biată chestiune de formă, minoră și adesea invizibilă. Apoi putem evalua cam cîți contribuitori vor fi tracasați de schimbarea diacriticelor și cîți dintre ei ne vor părăsi?
Întrebarea mea e sinceră, chiar nu am idee de lectura cîtor oameni ne batem joc trecînd la diacriticele corecte, pentru că sigur vor fi victime, dar nu-mi dau seama cît de multe. Majoritatea siturilor românești --- vorbesc de cele care folosesc diacritice --- au rămas la sedile. Singura excepție remarcabilă pe care o știu este DEX online, care permite totuși utilizatorilor înregistrați să opteze pentru afișarea cu sedile dacă au probleme cu virgulele.
Pe de altă parte Wikipedia nu trebuie nici să aștepte pînă cînd trece toată lumea la diacriticele corecte. Dimpotrivă, are destulă putere pentru a-i împinge ea însăși pe oameni să-și actualizeze softurile și a deveni exemplu de urmat și pentru alte situri. Dar întrebarea rămîne: cîți ne vor înjura că le forțăm mîna și cum va afecta asta proiectul? — AdiJapan 23 februarie 2010 12:14 (EET)Răspunde
Eu deja i-am înjurat pe cei care au venit cu ideea asta. Nu cred că este important cum scriem, ci ce scriem. Sunt de acord cu Adi aici. De când cu ideea asta, viteza de conexiune mi-a scăzut. Nu mai spun că sunt probleme la scriere în porcăria de IE8, dar ce să fac dacă mi s-a reproșat că eu țin proiectul în loc, dând dovadă de rea-voință. Ce bine îmi era cu IE6. --Cezarika1 23 februarie 2010 12:56 (EET)Răspunde
Am scris mai sus: afectați sunt aproximativ 7% dintre utilizatorii din noiembrie anul trecut, la nivel mondial. Asta înseamnă cca. 350.000 de cereri la ro.wp [9]. Cum numărul mediu de cereri/vizitator este de aproape 30 (de la [10] - page requests/unique visitors) rezultă cam 11000 de oameni (din cca. 160.000 vizitatori în total).
Poate părea mult, dar din noiembrie până acum a apărut Win7, iar utilizarea IE6 pe 3 situri din categoria Artă/Cultură de pe trafic.ro a scăzut după cum urmează:
  • cinemagia.ro (nr. 1): de la 18,45% la 15,81% (-14,4%)
  • poezie.ro (nr. 3, jumătate din numărul nostru de afișări): de la 23,95% la 19,10% (-20,3%)
  • enciclopediaromaniei.ro (nr. 41, același profil ca și noi): de la 24,35% la 20% (-17,9%)
Fără să am pretenția de a fi făcut calcule exacte din punct de vedere statistic, aș spune totuși că în luna februarie am avut în jur de 9000 de vizitatori cu probleme dintr-un total de vreo 160000. În acest moment fac eforturi să obțin date mai noi pentru Wikipedia în general, și dacă este posibil și pentru ro.wp în particular, însă deocamdată nu am niciun răspuns.
În ceea ce privește efectul asupra redactorilor, consider că sunt suficient de puțini încât să le putem oferi suport, inclusiv personalizat. Dacă se păstrează proporțiile, vorbim de vreo 30 de oameni cu totul, dintre care 3-4 care editează frecvent.
Oricum, trecerea nu va fi bruscă. Demersul pe care l-am inițiat ieri nu va avea niciun efect vizibil din punctul ăsta de vedere. După el ar trebui să urmeze:
  • Crearea mesajului din partea de sus a sitului și a unei pagini unde cei care au probleme pot fi ajutați
  • Creerea de redirectări de la virgulă la sedilă pentru titluri
  • Permisiunea acordată utilizatorilor de a scrie cu diacriticele pe care le doresc
  • O perioadă de evaluare a acestor schimbări (1-3 luni?) în care AD "răsturnat" să fie testat cât mai mult
  • Trecerea la diacriticele corecte, inclusiv mutarea articolelor de la sedilă la virgulă
Estimez că asta va lua aproape jumătate de an, timp în care în mod normal numărul de utilizatori afectați va scădea și mai mult. În concluzie, este posibil că în urma schimbării să pierdem câteva mii de vizitatori, dar nu cred că vom pierde un număr semnificativ de redactori (mai ales dintre cei cu multe contribuții, ca Cezar). --Strainu (دسستي‎23 februarie 2010 18:12 (EET)Răspunde
A, și încă ceva: nu ne împiedică nimeni să le oferim și noi vizitatorilor posibilitatea de a vedea paginile cu diacritice vechi, cum face dexonline.--Strainu (دسستي‎23 februarie 2010 19:07 (EET)Răspunde
7% cititori afectați mi se pare foarte mult, oricum mult peste pragul unei proporții neglijabile, pe care eu l-aș pune undeva la 1%. Să nu uităm că toată operația are ca rost satisfacția noastră mai mult pedantă decît utilă de a respecta meticulos standardul. Merită să lipsim 9000 de oameni de munca noastră doar pentru atîta lucru? Are tranziția asta avantaje reale?
Dorința de a fi scrupuloși o înțeleg foarte bine, că doar și eu cu mine însumi așa sînt, iar diacriticele vreau de mult să le schimbăm. Dar aici vorbim de o mulțime de oameni cărora le tăiem macaroana.
Probabil soluția ideală este ca noi, în bucătăria noastră, să trecem acum de la sedile la virgule, dar afișarea implicită să se facă în continuare cu sedile, și să existe o opțiune pentru cititorii care vor să vadă virgule. Iar cînd problema afișării virgulelor va deveni suficient de rară, să schimbăm afișarea implicită în virgule, eventual cu o opțiune pentru cei care vor să vadă sedile.
Minunat ar fi ca toată migrarea să se facă nu cu roboți, ci printr-o schimbare operată în server asupra întregii baze de date. Probabil că ar dura cîteva minute toată tranziția, că doar e vorba de o simplă căutare și înlocuire. În mod sigur ar fi mai simplu, mult mai rapid și mai puțin stresant. Oricum bănuiesc că avem nevoie de ajutorul dezvoltatorilor pentru a schimba spațiile de nume.
Ce ne rămîne nouă de făcut este să punem manual tagurile pentru cuvinte turcești cu ș, asta înainte de migrare. — AdiJapan 24 februarie 2010 12:31 (EET)Răspunde
Ce înțelegi prin "bucătăria internă"? În ceea ce privește spațiile de nume, trecerea la virgule (prin suprascrierea paginilor din MediaWiki mai degrabă decât direct în Translatewiki) nu ar afecta cu nimic interfața, tocmai datorită acelor aliasuri. Exact cum poți să zici "Talk Wikipedia" o să poți spune și "Discuție Wikipedia" în ambele variante.
Eu nu mai insist la fel de vehement ca anii trecuți pentru că am avut ocazia să văd câte IE6 mai există încă în firme, iar acolo nu prea ai alternative. Dar nu putem nici să nu progresăm deloc - trebuie măcar să lăsăm oamenii să scrie cu virgule în paginile de discuție și în cele de utilizator și să-i sprijinim în cazul în care scapă câte o legătură internă greșită prin crearea redirecturilor cu virgulă către articolele cu sedilă.
O altă problemă o reprezintă posibilitatea de a introduce avertismente pentru utilizatorii de IE6 atât în mesajul de bun venit, cât și în paginile care tratează subiectul (Ș, Ț, Wikipedia:Diacritice etc) chiar înainte de orice schimbare. În felul ăsta putem să mutăm articolele la titlul lor normal (cu virgulă) și să le explicăm de ce se vede prost.--Strainu (دسستي‎24 februarie 2010 13:58 (EET)Răspunde

Cred că întrebarea corectă este de ce dorim să facem această tranziție. Vede cineva în mod onest vreun avantaj real al utilizării virgulelor? Strainu, creezi o falsă dilemă atunci când spui „nu putem nici să nu progresăm deloc”. A nu progresa deloc ar însemna să obligăm pe toată lumea să lucreze cu Windows XP și/sau să nu scrie decât cu sedile. Or în realitate am venit în întâmpinarea celor care au ales să-și înnoiască sistemele prin implementarea uneltei auto-diacritice. Situația curentă este că în practică toată lumea este fericită atât cu editarea cât și cu consultarea enciclopediei, indiferent de sistemul de operare și setările de tastatură pe care le folosesc. În acest context revin cu întrebarea inițială: de ce dorim să facem această tranziție? Ce avantaj real vedeți în utilizarea lor? Pedanți suntem destul de mulți pe-aici, dar hai să fim și pragmatici. --Gutza DD+ 24 februarie 2010 14:21 (EET)Răspunde

Strainu, „bucătăria noastră” înseamnă editarea propriu-zisă, adică ce litere conține baza de date și ce litere văd contribuitorii în caseta de editare. Acolo putem trece ceva mai ușor la diacritice corecte, pentru că pe contribuitori îi putem ajuta personal să-și configureze calculatorul și la o adică putem folosi un AD invers, sistematic și universal (care va trebui să recunoască excepțiile). Pe cititori în schimb nu-i prea putem ajuta. Ei vin, văd pătrățele și pleacă.
În paginile de discuții și de utilizator lumea poate și acum să scrie în ce limbă și cu ce diacritice vrea. Sigur, sînt total de acord să creăm redirecturi de la titlurile cu virgule spre cele cu sedile, asta putem s-o facem deja de acum, că nu încurcă pe nimeni. Dar nu e un mare progres, pentru că oricum cei care scriu cu virgule au în general AD-ul activat. Problema se pune pentru partea de enciclopedie, care se adresează unui mare număr de oameni neimplicați în proiect.
Dar astea sînt detalii. Aș vrea, la fel ca Gutza, să aflu dacă tranziția are vreo altă utilitate în afară de satisfacția noastră de a respecta standardul și de imaginea oarecum mai de prestigiu pe care am putea s-o cîștigăm în fața puținilor cititori care se uită cu lupa la litere să vadă dacă am trecut la virgule. Există implicații privind căutarea cu Google sau cu funcția noastră de căutare? Asigurăm vreo compatibilitate cu ceva? Este ceva care funcționează mai bine cu diacriticele corecte? — AdiJapan 24 februarie 2010 16:14 (EET)Răspunde
  1. Asigurăm compatibilitatea cu limba română literară.
  2. Cu puțin noroc, vom fi creatorii unui trend, nu cei de la coadă.
Gutza, nu creez o falsă problemă. Mie AD nu-mi funcționează cum trebuie peste tot și mă mai trezesc că am legături roșii din cauza diacriticelor. De când am trecut la Win7/Linux, eu unul mă simt marginalizat și limitat de aceste lucruri. Să vă reamintesc ce scandal a ieșit când a venit prima dată dl. Țetcu și a avut acea atitudine de "de ce să schimb eu?". În mod clar în acest moment de dragul cititorilor facem dificil accesul unei categorii de redactori în continuă creștere, cei care scriu cu diacritice corecte.--Strainu (دسستي‎24 februarie 2010 16:31 (EET)Răspunde

Bun, dacă problema e că nu-ți merge AD atunci de ce nu ne concentrăm pe rezolvarea problemei care te împiedică pe tine să folosești AD în loc de a implementa o soluție care afectează 9.000 de cititori și câteva zeci de redactori? Cred că nici tu nu iei foarte în serios celelalte motive pe care le-ai enunțat mai sus (compatibilitatea (??) și „trendsettingness”), așa că nu mă apuc să le discut. --Gutza DD+ 24 februarie 2010 16:45 (EET)Răspunde

Și cum activezi AD automat pentru cei care vor să contribuie și au virgule?--Strainu (دسستي‎24 februarie 2010 17:12 (EET)Răspunde

Dacă decidem că asta e o problemă și este toată lumea de acord atunci îl putem activa din common.js. --Gutza DD+ 24 februarie 2010 17:28 (EET)Răspunde

Asta înseamnă că nu se vor mai putea edita articolele despre literele cu diacritice, ceea ce mie mi se pare inacceptabil. Trebuie găsită o soluție cât mai personalizată, nu să dai cu toporul. Observ în continuare o lipsă de grijă față de cei peste 100 de oameni care chiar contribuie (cu virgule) la proiectul ăsta, spre deosebire de cei 9.000 care stau și se uită. Nu îmi pot explica atitudinea voastră decât prin faptul că 9000>100. Dacă e ceva ce-mi scapă, explicați-mi și mie vă rog.--Strainu (دسستي‎24 februarie 2010 17:36 (EET)Răspunde

Posibil că-ți scapă faptul că tocmai m-am oferit să identificăm bug-ul care te afectează. Poate că îți mai scapă și faptul că ești singurul din cei peste 100 de oameni care contribuie cu virgule la proiectul ăsta și care ai în mod simultan o problemă cu AD și susții tranziția la virgule.

Legat de cele câteva articole în care există o nevoie legitimă de a include caractere cu virgule cred că am putea găsi o soluție, presupunând că ne-am putea axa pe o direcție de rezolvare. --Gutza DD+ 24 februarie 2010 17:55 (EET)Răspunde

Pe logica asta as putea sa-ti raspund ca Cezar e singurul cu IE6 care se opune acestei schimbari, dar nu cred ca mai merita sa continuam. Te intreb in schimb (pe tine si pe toti ceilalti care inca se mai opun schimbarii): aveti ceva impotriva permisiunii de a scrie cu virgula in paginile de discutii, a generarii de redirectari cu virgula si a aliasurilor de namespace?--Strainu (دسستي‎24 februarie 2010 18:38 (EET)Răspunde

Nu ar fi un răspuns legitim cel pe care mi l-ai propus -- Cezar e singurul care se opune schimbării pentru că e printre puținii care au apucat să fie afectați de schimbarea însăși, până când s-a implementat soluția cu AD (soluție implementată chiar în urma unor discuții cu Cezar). Mai interesant ar fi câți s-ar opune dacă am începe procesul efectiv de transformare a paginilor, însă tocmai ăsta e pariul pe care nu vreau să-l facem.

Eu unul n-am nimic împotriva propunerii tale conservatoare de mai sus -- poate ar fi chiar util să permitem scrierea cu virgulă în paginile de discuții; în felul ăsta am putea începe să vedem câtă lume se declară deranjată de caracterele cu pricina (adică tocmai ce încercăm să aflăm). Și asta fără ca funcționalitatea principală a enciclopediei să aibă de suferit. Sincer să fiu, cu cât mă gândesc mai mult la propunerea ta cu atât mi se pare mai bună. --Gutza DD+ 24 februarie 2010 19:06 (EET)Răspunde

Sînt de acord cu cele trei propuneri: scrisul cu virgule în paginile de discuții, crearea de redirecturi și adăugarea de aliasuri. De fapt am mai spus asta.
Apropo de editarea articolelor despre litere cu virgulă: nu știu exact cum funcționează acum AD-ul, dar trebuie făcut în așa fel încît să se poată forța păstrarea literelor cu virgulă, de exemplu cu un span folosit în mod excepțional: <span lang='ro'>litera Ș</span>. — AdiJapan 25 februarie 2010 06:02 (EET)Răspunde

"Singurul avantaj al migrării este alinierea la standard, dar pentru imensa majoritate a cititorilor nu e decît o biată chestiune de formă, minoră și adesea invizibilă"-De fapt, eu nu pentru asta am propus migrarea, ci din rațiuni practice. Sunt tot mai mulți oameni care folosesc Vista, Windows 7, Mac OS X sau iPhone, oameni care la moment nu pot edita la Wikipedia, nu pot accesa articole direct din bara de adrese a browserului ș.a.m.d. Într-adevăr pe Windows există posibilitatea de a schimba tastatura pe "Română (tradițională)" pentru a folosi caracterele pentru sedilă, dar asta e o necunoscută pentru mulți. Iar pe Mac nu există o tastatură tradițională de default, decât câteva pachete făcute de amatori și postate pe forumuri. Pe iPhone deloc și, din câte îmi amintesc, are jumătate din traficul de internet mobil din România (nu găsesc acum știrea). Bineînțeles nu editează mulți de pe iphone, dar sigur sunt mulți care accesează Wikipedia, și nu pot merge direct la articolele dorite (de exemplu la http://ro.wikipedia.org/wiki/țară ). --Danutz (discuție) 27 februarie 2010 15:18 (EET)Răspunde

Working on that - am ajuns cu crearea de redirectări cu virgulă la articolele ce încep cu "Biserica". Mai e de lucru, mai ales că nu-l las nesupravegheat, dar sper să termin săptămâna viitoare. În ceea ce privește spațiile de nume, mai puneți și voi presiune pe dezvoltatori la bugzilla. :)--Strainu (دسستي‎27 februarie 2010 15:49 (EET)Răspunde
Danutz, deocamdată Win 7 + Vista au în mod cumulat cel mult 50% din numărul de utilizatori care folosesc XP sau mai vechi. Iar asta în condițiile în care cei cu Win 7 și Vista pot vedea și scrie ambele variante de diacritice, în timp ce cei cu Win XP abia pot vedea, dar nicicum scrie cu virgule. În condițiile astea migrarea cu totul către virgule mi se pare foarte nepotrivită, așa după cum am spus și mai sus. Susțin demersurile conservatoare ale lui Strainu, însă pentru moment nici vorbă să mergem mai departe decât atât. --Gutza DD+ 27 februarie 2010 16:21 (EET)Răspunde
„Sunt tot mai mulți oameni care folosesc Vista, Windows 7, Mac OS X sau iPhone, oameni care la moment nu pot edita la Wikipedia, nu pot accesa articole direct din bara de adrese a browserului ș.a.m.d.” --- Dacă este adevărat că oamenii aceia chiar nu pot contribui atunci e grav. Dar nu văd ce-i împiedică să editeze. Că scapă litere cu virgulă prin articole? Asta nu este ceva atît de groaznic, pentru că: 1. poate trece oricînd în urma lor cineva care folosește AD; 2. Cu redirecturile făcute de Strainu legăturile interne cu virgulă nu vor mai fi nefuncționale; 3. De obicei contribuitorii în cauză sînt contactați personal și rugați să-și activeze AD-ul; 4. În rest la urma urmei sînt afectați numai vreo 7% din cititori care nu pot citi bine cîteva articole din 140.000.
Faptul că nu pot fi accesate paginile direct din bara de adrese mi se pare minor. Cei care vor să facă asta se pricep în general destul de bine ca să-și rezolve problema. Iar articolele pot fi găsite și altfel, de exemplu prin căutare. — AdiJapan 27 februarie 2010 17:43 (EET)Răspunde
Dacă nu greșesc eu prea tare, singurii care nu pot vedea caracterele sunt utilizatorii de Internet Explorer 6 (care are o cotă de 14%-în scădere cu 10 procente față de martie 2009; asta în România; și o cotă modestă de 4,5% în Moldova). Din câte știu, în IE 7 și 8 fonturile sunt corectate. În plus, și dintre cei cu IE6 o mare parte au instalată actualizarea de font (eu așa țin minte că s-a făcut automat; ar fi binevenit să verifice cineva).
Pentru a evita probleme de compatibilitate, ar trebui să alegem una dintre variante: s-sedilă sau s-virgulă. Așa de exemplu, dacă eu în interiorul noului meu articol "țară" (pe stil nou) fac o referire la București (pe stil nou), să nu-mi apară o legătură roșie. La fel, când cineva scrie un articol și include un link către "țară" pe stil vechi, acesta să nu apară ca inexistent. Asta se poate rezolva prin redirecționări, dar tot va fi o întârziere (considerabilă) până la crearea redirecționării, și deci vor apărea probleme de compatibilitate între timp. O soluție ar fi ca la fiecare apăsare pe butonul "Salvează pagina" să se facă automat conversia la un set de caractere. Eu aș prefera setul nou, pentru că, după cum am văzut, cota IE 6 e în scădere drastică.--Danutz (discuție) 27 februarie 2010 21:38 (EET)Răspunde
Acum despre tranziție. Putem crea un buton prin care să se schimbe setul de caractere. Exact la fel ca pe sr.wiki, unde se face conversia de la scrierea chirilică la scrierea latină. Fără prea mare greutate utilizatorii de IE 6 pot fi detectați și să li se propună "vizualizarea în modul compatibil" (asta se poate face și automat, fără să-i mai întrebăm măcar).
Dacă asta vi se pare încă prea mare bătatie de cap, atunci ar fi o soluție și să mai așteptăm până când cota IE 6 în România scade sub 5% (ceea ce cred că se va întâmpla anul ăsta), și atunci să facem migrarea. Dar până atunci, ar trebui să avem totul pregătit.--Danutz (discuție) 27 februarie 2010 21:15 (EET)Răspunde
P.S. Referitor la tastarea direct din browser a adreselor. Eu îmi aduc aminte că încă de la început accesam articolele direct din bara de adrese. Nici voi nu cred că ați folosit vreodată (nici măcar la început), rubrica aceea de căutare din meniul din stânga. Sau dacă ați folosit-o, ați făcut asta foarte rar. Greșesc?
Și mai e încă ceva. Din martie, toți utilizatorii de Windows din UE care au Internet Explorer ca browser implicit, vor primi un mesaj prin care vor fi îndemnați să-și instaleze un browser nou dintr-o listă (există o înțelegere între Microsoft și autoritățile din domeniul concurenței din UE). E vorba practic de o fereastră cu titlul "O alegere importantă: browserul dvs.", care va arăta cam așa. Atunci IE6 va fi ca și dispărut. Să nu mai menționez că Google a renunțat de curând să mai optimizeze pentru IE6, chiar dacă browserul are încă o cotă de vreo 20 de procente la nivel mondial.--Danutz (discuție) 27 februarie 2010 21:39 (EET)Răspunde

Ce face Microsoft astăzi este puțin important, important este ce folosește lumea de fapt. Win XP SP3 și IE8 vin cu auto-update, dar tot sunt relativ mulți care nu au făcut aceste actualizări. Dar hai să zicem că cei mai mulți dintre utilizatorii de Windows XP au totuși actualizările la zi; hai să zicem că au toți IE8. Rămâne întrebarea cine o să scrie articole cu virgule, dat fiind că utilizatorii de Vista și Windows 7 sunt în continuare în minoritate, indiferent de orice altceva. Spui că "pentru a evita probleme de compatibilitate, ar trebui să alegem una dintre variante: s-sedilă sau s-virgulă", dar această alegere a fost făcută cu mult timp în urmă: s-sedilă. Este uniform implementată peste tot în Wikipedia; singura excepție de la această regulă a apărut acum 24 de ore când am decis să permitem scrierea cu virgule în paginile de discuție pentru a începe să evaluăm impactul acestor caractere în scenarii reale (simpla lectură a acestei secțiuni te-ar fi lămurit). Va dura luni de zile până să putem face o evaluare preliminară.

Acestea fiind spuse, suntem cu toții de acord că trebuie să fim pregătiți pentru momentul la care se va face migrarea propriu-zisă, însă în opinia mea nu e nicio grabă. --Gutza DD+ 27 februarie 2010 22:17 (EET)Răspunde

P.S. Eu mai vizitez Wikipedia de pe un Nokia E71 și nu văd caracterele cu virgulă. Cei cu iPhone văd și sedile. Știu, ei sunt mai mulți, dar sedile vedem toți, virgule văd numai ei... --Gutza DD+ 27 februarie 2010 22:29 (EET)Răspunde

Nu numai IE8 rezolvă problema, și IE7 tot la fel o rezolvă. Mai sus în pagină este un script care ar afișa caracterele vechi pe browsere vechi gen IE6 sau Nokia. Și atunci, mă întreb: pentru ce să mai așteptăm? De ce 14% de utilizatori IE6 bat 23% de utilizatori de Vista/7/Mac. Mai ales că cifra aceea de 14% e în scădere drastică. Ok, hai să mai așteptăm până ajunge la 5% (deși nu pricep de ce, dacă am avea un script care să le arate utilizatorilor de IE caracterele vechi), dar de ce să așteptăm o veșnicie?--Danutz (discuție) 27 februarie 2010 23:32 (EET)Răspunde
„De ce 14% de utilizatori IE6 bat 23% de utilizatori de Vista/7/Mac.” --- A vedea sedile în loc de virgule este un fleac. A vedea pătrățele în loc de litere e distrugător.
Apropo de rubrica de căutare, în ultimii ani și-a schimbat mult comportamentul. După ce scrii primele litere îți afișează o listă de sugestii, adică titluri care încep cu literele respective. Apoi, foarte relevant în discuția de față, căutarea nu se mai împiedică în diacritice. Poți să cauți cuvinte cu S, cu Ș, cu Ș, și îți găsește toate rezultatele: cu Golesti îți găsește Golești, și invers, cu Emineșcu îți găsește Eminescu. Din cauza asta redirecturile fără diacritice au devenit deja aproape inutile. Și ca să-ți răspund, nu mai accesez practic niciodată pagini prin bara de adrese; acum folosesc aproape exclusiv rubrica de căutare. Oferă mai multă flexibilitate, mai mare toleranță la greșeli de tastare și faci efort mai mic.
Cea mai bună soluție pentru cititori ar fi ca serverul să îi trimită automat fiecăruia paginile în funcție de capacitatea de afișare a browserului. Dacă se poate face asta atunci jumătatea grea din problemă se rezolvă și mai rămîn contribuitorii. — AdiJapan 28 februarie 2010 09:17 (EET)Răspunde
Dar cine ar vedea pătrățele, nu pricep? Există un script care ar afișa caracterele vechi pentru utilizatorii de IE6. --Danutz (discuție) 28 februarie 2010 15:43 (EET)Răspunde
Stai așa, eu trăiam cu impresia, după calculele lui Strainu, că dacă am trece acum la virgule vreo 7% din cititorii noștri ar vedea pătrățele. Am înțeles greșit? — AdiJapan 28 februarie 2010 16:58 (EET)Răspunde
Cred că Dănuț se referă la o variantă de "Diacritice corecte" care să afișeze sedile în loc de virgule. Vezi punctul 5 de la Wikipedia:Corectarea diacriticelor#Probleme_care_trebuie_rezolvate_pentru_o_migrare_lin.C4.83. Această opțiune va trebui folosită oricum, problema e dacă acum sau mai târziu.--Strainu (دسستي‎28 februarie 2010 17:17 (EET)Răspunde

S-a ramificat atât de mult discuția încât e greu chiar și pentru cei implicați să țină minte toate argumentele pro și contra diverselor variante propuse. Poate ar trebui o secțiune de sinteză, sau un tabel PRO/CON. --Gutza DD+ 28 februarie 2010 17:49 (EET)Răspunde

Idee: ar trebui ca AD să ocolească și Wikipedia:Cafenea, întrucât acolo se desfășoară cea mai mare parte a discuțiilor.Sebimesaj 1 martie 2010 14:56 (EET)Răspunde

  Realizat Să înceapă balul...--Strainu (دسستي‎1 martie 2010 23:17 (EET)Răspunde

Statistici Cafenea după o lună

modificare

A trecut mai bine de o lună de la decizia de acceptare a diacriticelor cu virgulă la Cafenea. Am făcut de curiozitate o statistică a caracterelor folosite în acea pagină, cu scopul de a verifica repartizarea redactorilor în funcție de capacitatea lor de a scrie folosind diacriticele noi. Procedura a fost să descarc un executabil de la http://www.sil.org/ și să analizez conținutul efectiv al paginii (copiat sursa paginii într-un fișier local). Rezultatele sunt următoarele în zona care ne interesează:

Cod	Caracter	Count
------------------------------------------
U+015E	Ș (sedilă)	18
U+015F	ș (sedilă)	380
U+0163	ț (sedilă)	804
[total]	total sedile	1202
------------------------------------------
U+0218	Ș (virgulă)	3
U+0219	ș (virgulă)	92
U+021B	ț (virgulă)	91
[total]	total virgule	186

Sigur, metodologia este dubioasă fiindcă depinde mai mult de cantitatea de text scrisă de fiecare persoană în parte decât de numărul de persoane care au scris textul propriu-zis (i.e. dacă un singur individ scrie o pleașcă uriașă de text atunci va înclina statisticile globale către diacriticele pe care le preferă întâmplător acel individ, ceea ce nu este dezirabil). Totuși, una peste alta, rezultatele nu sunt chiar irelevante deoarece reprezintă într-un fel (deși cu aproximații) cantitatea de text scrisă cu diacriticele vechi/noi de către redactori, în funcție de nivelul lor de activitate la Wikipedia.

După cum se vede mai sus, ponderea celor care scriu cu sedile este deocamdată convârșitoare. Prin urmare avem două probleme circulare în micul nostru experiment legat de Cafenea:

  1. Lumea nu prea scrie cu virgule, indiferent dacă ceilalți ar putea citi sau nu textele cu virgule;
  2. Cei care nu pot citi texte cu virgule nu se plâng pentru simplul motiv că nu prea au ocazia să se întâlnească cu texte scrise cu virgule, din cauza problemei anterioare.

În condițiile curente este cu siguranță foarte bine să păstrăm status quo-ul actual legat de scrierea cu virgule în paginile de discuție și la Cafenea, în așa fel încât să putem monitoriza în continuare situația (probabil în stilul acestei analize, dacă nu se obosește nimeni să scrie o aplicație dedicată care să genereze statistici mai relevante). --Gutza DD+ 6 aprilie 2010 01:49 (EEST)Răspunde

Ca să nu mă las mai prejos, am făcut și eu o statistică pentru a vedea cine și cum a scris la Cafenea începînd cu 2 martie.
Raportul numeric găsit de Gutza e de 1 virgulă la 6 sedile și jumătate. După numărul de utilizatori raportul e mai puțin drastic: 1 virgulist la 3 sediliști. Sigur, asta nu schimbă concluziile lui Gutza privind oportunitatea tranziției.
Iată concret:
Sedile Virgule
  1. AdiJapan
  2. Mycomp
  3. Strainu
  4. Turbojet
  5. Ark25
  6. Victor Blacus
  7. Miehs
  8. Pouiou Raphaelle
  9. Ionutzmovie
  10. Alex F.
  11. Meszzoli
  12. GEO
  13. Sîmbotin
  14. Despina Alexandru Ioan
  15. 92.80.*.*
  16. NeaNita
  17. Iorest
  18. Andrei Stroe
  19. Leopardul
  20. Cezarika1
  21. Tadiw2
  22. Rsocol
  23. Ioana 03051988
  24. Silenzio76
  25. TudorTulok
  26. Petru Di‎mitri‎u
  27. Gikü
  28. Gutza
  29. Lucian C.
  30. ManoleM
  31. Luciandrei
  1. Strainu
  2. Gutza
  3. AdiJapan
  4. DacuBurebista
  5. Tct13
  6. Mgall
  7. Sîmbotin
  8. Parvus7
  9. Mycomp
  10. Dany 123

De notat un aspect interesant din statistica lui AdiJapan: dintre cei zece care au scris texte cu virgule, jumătate au scris și text cu sedile (AdiJapan, Gutza, Mycomp, Sîmbotin, Strainu). Cu alte cuvinte acești cinci din cei zece care au scris și text cu virgule nu ar putea probabil să fie consecvenți în utilizarea virgulelor (în cazul meu de exemplu fiindcă folosesc diverse calculatoare pentru a scrie la Wikipedia, dintre care unele au Windows Vista sau mai nou iar altele nu). Rămân deci în realitate doar cinci utilizatori despre care nu putem spune în mod cert că ar fi inconsecvenți (poate că și dintre aceștia unii sunt într-o situație similară, dar au scris întâmplător doar cu virgule mesajele pe care le-au introdus la Cafenea în perioada analizată). Ar rămâne deci un raport de 31/5=6 sediliști sau indeciși la un virgulist presupus consecvent. Ceea ce este surprinzător de aproape de raportul identificat prin simpla analiză a frecvenței fiecărei variante de diacritice în text. --Gutza DD+ 6 aprilie 2010 14:39 (EEST)Răspunde

Copiez aici pentru posteritate statistica lui AdiJapan reîmpărțită după criteriile descrise deasupra. Cred că e cea mai bună împărțire și pentru analize și comparații viitoare.

Sediliști Indeciși Virguliști
  1. Turbojet
  2. Ark25
  3. Victor Blacus
  4. Miehs
  5. Pouiou Raphaelle
  6. Ionutzmovie
  7. Alex F.
  8. Meszzoli
  9. GEO
  10. Despina Alexandru Ioan
  11. 92.80.*.*
  12. NeaNita
  13. Iorest
  14. Andrei Stroe
  15. Leopardul
  16. Cezarika1
  17. Tadiw2
  18. Rsocol
  19. Ioana 03051988
  20. Silenzio76
  21. TudorTulok
  22. Petru Di‎mitri‎u
  23. Gikü
  24. Lucian C.
  25. ManoleM
  26. Luciandrei
  1. AdiJapan
  2. Gutza
  3. Mycomp
  4. Sîmbotin
  5. Strainu
  1. DacuBurebista
  2. Tct13
  3. Mgall
  4. Parvus7
  5. Dany 123

Combinând cele două tehnici (frecvența diacriticelor în text pe de o parte și numărul sediliștilor/indecișilor/virguliștilor pe de altă parte) cred că vom putea monitoriza evoluția situației într-un mod cât se poate de satisfăcător. --Gutza DD+ 6 aprilie 2010 16:26 (EEST)Răspunde

Mă puteți terce la "virguliști", mi-am instalat driverul de la Secărică și la muncă :)--Strainu (دسستي‎22 aprilie 2010 12:40 (EEST)Răspunde

De când în Windows XP?

modificare

Încerc să determin de când sunt de fapt vizibile diacriticele corecte în Windows XP și nu reușesc să-mi dau seama. S-a spus mai sus că de la SP2 -- nu este adevărat, EUupdate.EXE necesită SP2 și a fost publicat după SP2 (SP2 în 2004, EUupdate.EXE în 2007). Posibil ca SP3 să fi introdus suportul pentru diacriticele corecte, însă nu reușesc să găsesc nimic în acest sens în lista de la Microsoft. Pe de altă parte am testat cu o mașină care nu are instalate decât update-urile automate și pot citi diacriticele corecte, deci este un update automat pe undeva care face asta, însă nu reușesc deloc să aflu care este și când a fost publicat... Are cineva vreo idee? --Gutza DD+ 14 aprilie 2010 12:31 (EEST)Răspunde

Ți-a venit IE8 ca actualizare? Dacă da, asta e explicația. Vezi [11]--Strainu (دسستي‎14 aprilie 2010 13:49 (EEST)Răspunde
Aha, bună observația -- am să verific explicit ce actualizări conține IE8. Mi s-a instalat automat IE8, deși nu l-am "activat" (e o mică procedură de migrare la IE8 căreia nu i-am dat curs, însă presupun că dacă actualizarea face parte din pachetul IE8 atunci fonturile s-au modificat independent de decizia mea de activare). Revin cu informații. --Gutza DD+ 14 aprilie 2010 14:16 (EEST)Răspunde
Nu am reușit să găsesc nicăieri o informație clară în privința asta, așa că rămânem deocamdată cu presupunerea celor de la Microsoft. (Ciudat ca poziția oficială a Microsoft să fie o presupunere în privința propriilor produse, dar în fine.) --Gutza DD+ 14 aprilie 2010 16:05 (EEST)Răspunde

Nume turcești

modificare

Am terminat marcarea articolelor din Categorie:Turcia și subcategorii. Dacă observați lipsuri vă rog să le corectați sau să-mi spuneți. De asemenea, dacă știți de alte articole care nu intră în această categorie, zbierați.--Strainu (دسستي‎10 mai 2010 14:35 (EEST)Răspunde

Dacă ai putea face o listă cu toate cuvintele turcești cu Ș pe care le-ai găsit, le-am putea căuta în toată baza de date. Cred că operația se poate automatiza și nu mai rămîn multe cuvinte turcești nemarcate.
Mai rămîne problema lui T-sedilă: chiar dacă litera asta nu e folosită în nici o limbă, uneori avem nevoie să scriem despre ea, deci ne trebuie un sistem de a o marca pentru a o feri de conversie. Ai vreo idee? — AdiJapan 13 mai 2010 13:17 (EEST)Răspunde
Păi, pentru T-sedilă nu prea avem de ce să aplicăm altă metodă - marcarea e incorectă din punct de vedere lingvistic, dar nu afectează nici cititorii, nici roboții. Dar în cazul ăsta vorbim de o mână de articole (nu?), putem pur și simplu să le excludem pentru toți roboții.
O să încerc să fac săptămâna asta lista.--Strainu (دسستي‎13 mai 2010 18:20 (EEST)Răspunde
Mă gîndeam că ar fi util să creăm un tag special, de uz mai general decît pentru T-sedilă, care să le spună roboților să nu se atingă de o anumită bucată de text. Zilele trecute robotul lui Andrei a corectat niște cuvinte care erau scrise intenționat greșit: ultimile -> ultimele. Același tag ar putea fi folosit și pentru a discuta despre literele T-sedilă și S-sedilă în articole care n-au legătură cu limba turcă (așa este, sînt numai cîteva astfel de articole) și în general pentru orice text care riscă să fie modificat ulterior de roboți. Ar fi și mai simplu și mai eficient decît să alcătuim liste de articole-excepții, pentru că din acele articole numai anumite bucăți mici trebuie lăsate neschimbate. — AdiJapan 13 mai 2010 18:41 (EEST)Răspunde

Dacă vreau să scriu un ș cu sedilă care să rămână așa, pot scrie &#351; sau &#x15F; și rezultă ş . Dar ce fac atunci când vreau să se păstreze wikilinkul Timiș (cu sedilă) și după ce trece robotul de corectare automată peste text? Se poate scrie Timiș, dar mai există vreo altă soluție? —  Ark25  (discuție) 16 iunie 2010 16:58 (EEST)Răspunde

<span lang="x-sic">[[Timiş]]</span> are ca rezultat Timiş chiar și după corectare. Vezi Discuție_Utilizator:Gutza#sic.--Strainu (دسستي‎16 iunie 2010 17:14 (EEST)Răspunde

Cazuri specifice

modificare

Ce facem cu limbile derivate din turcă, gen Limba bașchiră? Înlocuim sau nu? Eu aș zice să înlocuim, că numele e românesc.--Strainu (دسستي‎18 mai 2010 21:44 (EEST)Răspunde

Atâta vreme cât cuvintele sunt românești nici nu se pune problema să le lăsăm cu sedile, indiferent din ce limbă vin. --Gutza DD+ 18 mai 2010 21:47 (EEST)Răspunde

Translatewiki

modificare

Pentru când vom face migrarea: cum vom proceda cu textele existente la translatewiki.net? Traducerile de acolo sunt folosite în mai multe locuri, printre care și Wikipedia.Sebimesaj 18 mai 2010 14:30 (EEST)Răspunde

Bănuiesc că lucrurile se vor întîmpla cam așa: multă vreme (ani) după ce facem tranziția va exista la ro.wp un robot care să patruleze schimbările recente și care va converti diacriticele acolo unde e cazul. Multă lume va continua să le folosească pe cele vechi și sigur nu vor fi toți așa de drăguți să-și activeze unealta autodiacritice inversă. Printre paginile patrulate de robot vor fi și cele din spațiul MediaWiki. Cînd apar texte cu sedile, le virgulește. (Robotul să aibă permisiuni de administrator.)
Cred că degeaba le spunem celor de la translatewiki.net să treacă la virgule. Pe de o parte aceeași interfață este folosită și de situri care vor să rămînă la sedile, fiindcă nu vor să-și bată capul cu unelte speciale. Iar pe de altă parte nu avem garanția că printre traducători nu vor exista și sediliști convinși. E mai simplu să corectăm noi aici. — AdiJapan 18 mai 2010 14:52 (EEST)Răspunde
Din păcate nu merge așa - cel puțin numele de spații de nume vor fi cu virgulă de acolo - așa au cerut cei care se ocupă de servere. În ceea ce privește celelalte texte, mi se pare ciudat să rămână parțial cu sedile, parțial cu virgule - eu l-am rugat pe Siebrand ca după ce trecem noi la virgule să ruleze un robot care să le transforme, dar dacă nu sunteți de acord puteți să vă exprimați opoziția acolo, la pagina de suport. Adi, ești sigur că noi avem suprascrise TOATE textele în spațiul de nume MediaWiki? Eu nu sunt.--Strainu (دسستي‎18 mai 2010 15:12 (EEST)Răspunde
(Scuze că nu am pus mesajul unde trebuia, de la început) Nu, există încă foarte multe traduceri prezente exclusiv la transaltewiki.net. Iar cei de acolo m-au sfătuit să continui cu localizarea tot acolo.Sebimesaj 18 mai 2010 15:33 (EEST)Răspunde
Apropo, poate sunteți interesați (aș avea nevoie de îndrumări pentru traducerea uniformă a textelor licențelor) de discuția asta.Sebimesaj 18 mai 2010 15:39 (EEST)Răspunde
Suprascrise nu cred că sînt. Dar mereu apar texte noi-nouțe, pentru funcționalități noi, care vin gata traduse de la translatewiki. Cu alea avem probleme --- asta cu diacriticele e o problemă nouă, dar de obicei traducerile lor suferă la capitolul politețe (adică lipsa ei), iar unele texte sînt picate din lună, fiindcă cine le-a tradus n-a avut idee în ce context urmau să apară. De-asta prefer să fac localizarea aici. N-au decît să preia ei de la noi, fiindcă traducerile noastre sînt mai în temă și cu terminologia mai bine bine standardizată. — AdiJapan 18 mai 2010 16:56 (EEST)Răspunde
Un exemplu concret: (arată/ascunde), care apare de astăzi sub numele de utilizator atunci când vizualizăm diferența între versiuni (Special:Șterge revizie). Nu cred că „arată/ascunde” este terminologia corectă.Sebimesaj 18 mai 2010 17:01 (EEST)Răspunde
Mai trebuie adăugat „revizia” lângă „arată/ascunde”.Sebimesaj 18 mai 2010 17:06 (EEST)Răspunde


Păi asta e problema tehnică Adi - dacă nu sunt suprascrise textele, paginile respective nu există, deci un robot nu folosește la nimic. Sigur, putem să aducem toate textele local, dar asta zici tu că nu e bine, deoarece noi avem versiuni uneori radical diferite și pentru că apar tot timpul texte noi. În plus, și fundația descurajează această abordare, preferând traducerile centralizate (chiar, ai putea să pui versiunile noastre la translatewiki dacă ți se par mai bune). Eu n-am nimic împotriva editării locale, mai ales că textele nu se schimbă prea des, dar dacă am înțeles bine ce zici tu, nu văd cum putem rezolva asta fără intervenție umană.

În ceea ce privește conținutul articolelor, sper să avem un AD care să știe de zone marcate și care să facă inutilă rularea permanentă a unui robot. Probabil îl vom rula din când în când, ca să fim siguri, dar ar trebui să avem 99% din editări cu virgulă.--Strainu (دسستي‎18 mai 2010 17:18 (EEST)Răspunde

Acum am înțeles treaba cu suprascrierile. Așa este, noile pagini din MediaWiki nu apar în schimbările recente, deci robotul trebuie să le caute el cumva. Eventual trece prin toată lista o dată la cîteva săptămîni sau luni.
Eu înțeleg că există avantaje la traducerea centralizată, dar cînd văd ce traduceri ne vin uneori îmi dau seama de un mare dezavantaj: traducătorii nu cunosc contextul. Unii probabil nici nu au multă experiență cu Wikipedia ca să știe ce termeni folosim. Uite, acum am trecut prin textele de interfață legate de noua funcționalitate cu ascunderea unor versiuni din istoric de către administratori (adineauri am observat-o). Peste tot traducerile erau cu cuvîntul revizie, deși noi spunem versiune (pentru că versiunea e o stare, iar revizia e un proces, or istoricul unei pagini e o listă de stări). Sigur, ar trebui să mă duc la translatewiki de fiecare dată, să modific traducerea de acolo și apoi să aștept o grămadă de timp pînă se propagă traducerea pînă la noi. Sau să fac treaba în două locuri.
În orice caz, cu textele de interfață cred că ne facem prea multe griji, fiindcă ele țin strict de aspect. Orice diacritice ar conține nu se strică nici o funcționalitate, nici o legătură internă, și în afară de administratori nu cred că mai caută (automat) cineva ceva în textele alea. Cititorii normali nici nu le accesează vreodată, deci nu ni se șifonează nici prestigiul. În concluzie pot să rămînă cu sedile încă multă vreme. Importante sînt în primul rînd paginile care țin de enciclopedie. — AdiJapan 18 mai 2010 17:42 (EEST)Răspunde

Robot conversie

modificare

Înainte de a discuta orice despre robot, trebuie implementat codul (scârbos) în JavaScript care să facă toate conversiile automate. Însă odată ce pasul acesta este gata vom putea începe să ne gândim la robot. Eu sunt dispus să rulez robotul respectiv, în special dacă este scris în PHP (pentru alte limbaje s-ar putea să fiu nevoit să instalez pachete specifice; sunt dispus să fac și asta, dacă sunt mainstream). --Gutza DD+ 18 mai 2010 21:58 (EEST)Răspunde

Mda, acum mă lupt cu expresiile regulate să văd ce iese. Pentru transformat virgule în sedile la deschiderea ferestrei de editare e de ajuns AD, nu?--Strainu (دسستي‎18 mai 2010 22:19 (EEST)Răspunde
Pentru virgule în sedile, da. Pentru viceversa însă e ce vezi tu că e. :-) --Gutza DD+ 18 mai 2010 22:25 (EEST)Răspunde

Scripturi ce vor funcționa în timpul tranziției

modificare

Am pus la punct niște scripturi pentru a asigura tranziția. În total, sunt 3 situații:

  1. un script care preia textul din caseta de editare și înlocuiește sedilele cu virgule, mai puțin unde este marcat altfel (AD inversat + administrare marcaje) - codul e în MediaWiki:Diacritice.js. Scriptul va fi activat pentru toți utilizatorii. Momentan nu are loc propriu zis înlocuirea, ci este afișat un avertisment cu textul înlocuit, în așa fel încât să poată fi verificat. După ce închideți fereastra, textul inițial este cel salvat. Nu e o soluție ideală , dar...
  2. un script care înlocuiește virgulele cu sedile la încărcarea paginii, inclusiv în fereastra de editare (Gadgetul diacritice corecte inversat) - codul e în MediaWiki:Diacritice.js. Acest script va fi activat pentru utilizatorii cu IE 4, 5, 6, precum și pentru utilizatorii de pe platforme mobile (de discutat care și dacă merită sau le punem în cap telefoanele). Aceasta e bucata de cod cea mai mare dpdv al consumului de timp (deci cea care va cauza cele mai mari probleme). Din păcate nu se poate face o estimare a felului în care va merge după trecerea la virgule - pur și simplu nu avem destule pagini mari cu virgule.
  3. un gadget care activează scriptul de mai sus și pentru ceilalți utilizatori care doresc acest lucru (WinXP + IE7/8 probabil)

Dacă doriți să testați aceste scripturi, trebuie să introduceți următoarele linii ambele linii de mai jos în Utilizator:Numele_dvs/monobook.js (vector.js dacă ati trecut la beta):

importScript("MediaWiki:Diacritice.js");
importScript("MediaWiki:Gadget-diacritice-vechi.js‎‎");

Merge să introduceți numai prima linie dacă nu vreți să testați afișarea cu sedile. Ordinea liniilor este importantă.

Situația telefoanelor mobile e mai complicată - din câte văd eu, sunt redirectate către o pagină cu alt aspect, deci e posibil să nu putem acționa asupra lor. Aș pune totuși scriptul și pentru symbian și android, poate ajută.--Strainu (دسستي‎20 mai 2010 13:27 (EEST)Răspunde

Deocamdată am dezactivat prima parte, deoarece lumea dorește deja să testeze partea a doua.--Strainu (دسستي‎20 mai 2010 16:01 (EEST)Răspunde
Bun, XPSP3 + Fx3.6.3. Instalat în monobook.js a doua linie (prima am înțeles că era dezactivată). Restartat Fx, niciun efect, niciun gadget suplimentar în preferințe. Nu știu de unde se activează. (Re)citind că „ambele” linii trebuie instalate, instalat și prima linie, repetat procedura, niciun efect. Ce mai am de făcut?
La întrebarea dacă mi se blochează, pagina România de 200K s-a încărcat fără probleme. --Turbojet 20 mai 2010 18:48 (EEST)Răspunde
Ctrl+Shift+R e necesar pentru actualizarea scripturilor. Nu uitați că majoritatea paginilor NU au virgule!--Strainu (دسستي‎20 mai 2010 19:08 (EEST)Răspunde
Am dat. Fără efect. --Turbojet 20 mai 2010 19:15 (EEST)Răspunde
Sunteți sigur că vedeți diferit literele șș, țț, chiar la dimensiune mare? Dacă da, puteți să apăsați Ctrl+Shift+J, să mergeți pe tabul "Errors" și să vedeți dacă aveți ceva erori legate de paginile Wikipedia (eventual un screenshot)? La mine acționează chiar acum...--Strainu (دسستي‎20 mai 2010 19:20 (EEST)Răspunde
Da, acum merge bine, testare cu succes :), mulțumesc. Interesant este că un moment am văzut literele puse de tine diferit (deci după Ctrl-Shift-R), dar acum nu le mai văd diferit. Îi trebuie puțin timp după Ctrl+Shift+R. (?) Până am făcut capturile cerute, a început să meargă. Dacă te mai interesează lista de erori, spune, ca s-o urc. --Turbojet 20 mai 2010 19:48 (EEST)Răspunde
E în regulă, mulțumesc pentru testare. Dacă dați peste probleme vă stau la dispoziție.
Nu știu de ce n-a mers imediat după refresh, dar în fine... Ce doresc să vă rog: cât aveți scripturile alea acolo, e mai bine să nu editați pagini care trebuie să conțină și caracterele cu virgulă (gen Ș, Ț, WP:DVN etc.). O să încerc să creez un Gadget cât de repede posibil.--Strainu (دسستي‎20 mai 2010 21:00 (EEST)Răspunde
A mai testat cineva scriptul de afișare sedile? Mă gândesc că ar fi timpul să îl punem în MediaWiki:Common.js--Strainu (دسستي‎24 mai 2010 19:18 (EEST)Răspunde
L-am introdus în Common.js. De acum, toți cei care au IE6 vor vedea sedile în loc de virgule. Am adăugat și gadgetul "Diacritice vechi", care să facă același lucru pentru toți cei doritori. Pentru că noul gadget duplică facilitățile oferite de AD, l-am scos pe acesta din urmă. Următorul pas ar fi după mine să permitem scrierea cu virgule în toate paginile, inclusiv în spațiul articolelor (aka să schimbăm politicile, căci de facto se întâmplă deja asta).--Strainu (دسستي‎27 mai 2010 01:27 (EEST)Răspunde
Observ că AD nu mai acționează schimbând diacriticele cu virgulă cu cele cu sedilă. Înseamnă că a început migrarea?Sebimesaj 27 mai 2010 14:45 (EEST)Răspunde
Și încă ceva: este normal ca Firefox să modifice diacriticele corecte care apar în bara de titlu a paginii (de pildă, în loc de „modificare Discuție Wikipedia:Corectarea diacriticelor (secțiune)”, în bara de titlu scrie „modificare Discuție Wikipedia:Corectarea diacriticelor (secțiune)”).Sebimesaj 27 mai 2010 14:47 (EEST)Răspunde

Am scris la cafenea că am scos AD. Dacă vrei să scrii cu sedile, îți activezi noul gadget, are același efect. Dacă nu se opune nimeni, în weekend voi schimba Wikipedia:Diacritice, să permită scrierea cu virgule. Nu se poate spune că a început migrarea, ci că vom intra serios în perioada de tranziție în care vor exista ambele tipuri de diacritice. De-abia acum se va vedea dacă apar plângeri cu privire la lizibilitate.--Strainu (دسستي‎27 mai 2010 16:32 (EEST)Răspunde

Scriptul pentru salvarea cu virgule este acum disponibil pentru testare. Nu înlocuiește sedilele din:
  • interwiki
  • formatele către alte proiecte: sisterlinks, commons, commonscat, incubator, interwiki, species, wikicitat, wikimanuale, wikisursă, wikitravel, wikiștiri, wikționar
  • legăturile către fișiere și categorii (momentan)
  • text marcat conform convenției
Pentru a folosi scrptul, adăugați linia de mai jos în Special:Pagina Mea/skin.js ("skin" e monobook sau vector, după caz):
addOnloadHook(save_new_diacritics);
Vă rog să verificați editările pe care le faceți cu acest script și să raportați problemele.--Strainu (دسستي‎4 iunie 2010 11:41 (EEST)Răspunde
Am găsit eu una (temporară ce-i drept): formatul {{Cutie Comune România}} introduce automat articolele în categorii de genul [[Categorie:Comune în județul {{{județ}}}]], citind conținutul parametrului „județ”. Am trecut astăzi prin articolul Comuna Finta, Dâmbovița, iar rezultatul a fost că nu se mai afișează categoria (pentru că nu există [[Categorie:Comune în județul Dâmbovița]] („Dâmbovița” scris cu „t” cu virgulă). Știu că e temporară, până se redenumesc și categoriile, dar până atunci o putem considera problemă.Sebimesaj 4 iunie 2010 14:10 (EEST)Răspunde
De asemenea, a modificat parametrii formatului CutieȚări (vezi diferența între versiuni) și, bineînțeles, acesta nu mai afișa conținutul așa cum ar trebui.Sebimesaj 4 iunie 2010 14:25 (EEST)Răspunde
Problema era și în formate. Momentan ignorăm toate formatele. Dă-i un Ctrl+Shift+R ca să iei noua versiune.--Strainu (دسستي‎4 iunie 2010 14:32 (EEST)Răspunde
Plec în curând, așa încât am ales o variantă super-conservatoare, în care înlocuirea nu va funcționa între primul început de format din pagină și sfârșitul ultimului format din pagină. Voi mai modifica luni în așa fel încât să sărim mai selectiv peste formate. Între timp, testele vor merge cum trebuie numai pe pagini simple.--Strainu (دسستي‎4 iunie 2010 14:43 (EEST)Răspunde
În regulă. Nu ne grăbește nimeni. Doar o altă chestie: pagina Special:Contribuții/Strainubot nu merge (cred că realizezi de ce — „ț”-ul).Sebimesaj 4 iunie 2010 15:15 (EEST)Răspunde

„ǎ”

modificare

Am descoperit astăzi ceva interesant: titlurile unor articole (cel create de Compactforever, altele nu am văzut) conțin un „ǎ” ciudat — ne este cel cu care ne-am obișnuit noi (adică „ă”). Ce-i de făcut? (Se poate considera tot diacrtică greșită, cum este cazul lui ș și ț cu sedilă?)Sebimesaj 20 mai 2010 20:57 (EEST)Răspunde

O să mă uit. Sigur, folosirea altor caractere față de cele normale intră aici, dar până acum n-am avut probleme din astea.--Strainu (دسستي‎20 mai 2010 21:00 (EEST)Răspunde
Am parcurs prima pagină de contribuții și n-am văzut nimic ciudat: Zaclău. Poți să dai exemple?--Strainu (دسستي‎20 mai 2010 21:04 (EEST)Răspunde
Poate că problema e la calculator.Memotalk with me 20 mai 2010 21:12 (EEST)Răspunde
Spišská Belá? Memotalk with me 20 mai 2010 21:16 (EEST)Răspunde

Dând o căutare după pagini scrise cu "ǎ" am găsit Fideism, Brăila iar la 30 septembrie e un "ǎ" pierdut la sfârșitul articolului.--Miehs (discuție) 20 mai 2010 21:25 (EEST)Răspunde

Într-adevăr, este vorba de caracterul „a caron”. La unele denumiri care nu sunt românești, trebuie. Dacă apar la cele românești, este posibil ca el să fi folosit o listă generată cu un editor de texte (nu avea diacritice pe tastatură), și acestea trebuie înlocuite. --Turbojet 20 mai 2010 21:42 (EEST)Răspunde
Puteți folosi regex tool cu care puteți înlocui un cuvânt sau o literă ușor, trebuie doar adăugat în monobook.js sau în vector.js (dacă folosiți aspectul vector):
*** Regex menu framework
*** by [[m:user:Pathoschild]] <http://meta.wikimedia.org/wiki/User:Pathoschild/Scripts/Regex_menu_framework>
***	- adds a sidebar menu of user-defined scripts.
*************/
importScriptURI('http://meta.wikimedia.org/w/index.php?title=User:Pathoschild/Scripts/Regex_menu_framework.js&action=raw&ctype=text/javascript');
 
/* menu links */
// In the function below, add more lines like "regexTool('link text','function_name()')" to add
// links to the sidebar menu. The function name is the function defined in rfmscripts() below.
function rmflinks() {
	regexTool('Custom regex','custom()'); // a default tool which performs regex input in a dynamic form
}
 
/* scripts */
// Below, define the functions linked to from rmflinks() above. These functions can use any JavaScript,
// but there is a set of simplified tools documented at
// http://meta.wikimedia.org/wiki/User:Pathoschild/Script:Regex_menu_framework .

Memotalk with me 20 mai 2010 22:08 (EEST)Răspunde

Exemple sunt în cadrul formatului {{Orașele Bulgariei}}. Am redenumit eu un articol: Vǎrbița.Sebimesaj 21 mai 2010 00:28 (EEST)Răspunde

Astăzi am dat și eu peste acest "ă" - A caron. L-am găsit prezent în 1266 de articole și în 8 titluri (din care 6 sunt "Văribița"). Acest caracter ar trebui înlocuit cumva automat în acele articole. Dar scriptul care acum înlocuiește ș-ul cu sedilă în ș-ul cu virgulă în momentul editării ar trebui să aibă în vedere și această înlocuire. În plus, ar trebui să aflăm cum este el produs (cu un editor anume sau poate prin folosirea tastaturii sârbe?). Am semnalat acest lucru și la Discuție:Ă. —  Ark25  (discuție) 22 ianuarie 2012 05:16 (EET)Răspunde
Ceea ce nu îmi dau seama totuși este de câte ori acest caracter apare legitim, ca nume de articol în legăturile interwiki. Ceea ce este cert totuși este că apare în articole fundamentale de genul Biologie : german care s-a nǎscut la 4 februarie 1776. —  Ark25  (discuție) 22 ianuarie 2012 09:10 (EET)Răspunde
Tocmai aparițiile legitime sunt problema. Mai acum vreo 2 luni mi-a scos Dahn ochii la en.wp că găsit el nu știu ce articol în care nu păstrasem diacriticele turcești. Dacă marchezi tu conform cu WP:DVN aparițiile legitime ale caracterului, putem să îl adăugăm la script fără probleme.--Strainu (دسستي‎22 ianuarie 2012 20:16 (EET)Răspunde

Alte probleme

modificare

Pe măsură ce înaintăm cu operațiunile de pregătire a tranziției apar probleme neașteptate:

  • Ce vom face cu legăturile externe care conțin diacritice cu sedilă? Vor fi și ele modificate de AD?
  • Ce vom face cu traducerile formatelor de la Commons, care conțin diacritice cu sedilă? Dar categoriile? Atunci când cineva va introduce formatul {{Commons}}, diacritica din cadrul cuvântului în cauză va fi și ea înlocuită de AD (mai grav este la denumirile turcești, care trebuie să rămână nemodificate, orice ar fi)? Cred că trebuie făcute, cel puțin, redirecționări la Commons, așa cum Strainu a făcut la noi (denumiri cu virgulițe → denumiri cu sedile). Același lucru este valabil și pentru celelalte proiecte surori (Cred că și acolo se va face tranziția, nu?).
  • La fel și cu legăturile interlinguale către alte limbi. Ei scriu cu sedilă, dar robotul nostru va modifica în caractere cu virgulă.

S-ar putea să mai existe și alte situații, dar acum nu le găsesc.Sebimesaj 21 mai 2010 14:23 (EEST)Răspunde

În URL-urile legăturilor externe nu există semne diacritice, deci nu sînt probleme.
La legăturile spre Commons trebuie păstrată denumirea care există la Commons, și apoi va trebui sincronizată mutarea paginii de la Commons cu schimbarea legăturilor de la ro.wp. E valabil și pentru Wikisursă, Wikționar, Wikiștiri etc.
Robotul nu trebuie să se atingă deloc de literele din legăturile interlinguale. Apoi, din nou, trebuie sincronizată mutarea paginilor de la alte Wikipedii cu schimbarea legăturilor de aici.
La formate avem trei chestiuni distincte, unele cu probleme:
  1. sedile în titlul formatului,
  2. sedile în numele parametrilor,
  3. sedile în textul parametrilor.
Ultima e simplă: pur și simplu se face trecerea la virgule, fiindcă e text inert, fără funcționalitate. Dar la primele două situații trebuie să fim atenți la ordinea operațiilor. N-aș putea să dau o soluție simplă și generală. Se poate face în așa fel încît să nu se strice nici un moment funcționarea formatelor? — AdiJapan 21 mai 2010 14:47 (EEST)Răspunde
Dar dacă, să spunem, textul parametrului trebuie să conțină neapărat sedile (limba turcă)? Cum ne dăm seama care litere trebuie înlocuite?Sebimesaj 21 mai 2010 15:12 (EEST)Răspunde
La fel ca peste tot altundeva, cu <span lang="tr">. Vezi la Yaşar Kemal cum e făcut formatul {{titlu corect}}--Strainu (دسستي‎21 mai 2010 15:29 (EEST)Răspunde
PS. Spuneam mai sus de niște sincronizări. Mi-am dat seama că nu e nevoie să sincronizăm nimic; e suficient să facem redirecturi mai întîi în exterior (Commons, Wikisursă, en.wp etc.) și apoi putem schimba legăturile noastre oricînd. Redirecturile se pot face deja de acum, că nu deranjează pe nimeni. — AdiJapan 21 mai 2010 14:51 (EEST)Răspunde
Celelalte proiecte vor trece la virgule când vor dori, nu le putem impune nimic. Cred mai degrabă că ar trebui să facem curățenie în legături, ca din ce văd eu multe nu mai duc nicăieri. Cele rămase ar putea fi verificate cu mâna. La Commons ar merita să rulăm un asemenea robot, o să întreb pe acolo.
La formatele locale, singurele probleme sunt sedile în numele parametrilor. Va trebui să mă mai gândesc la o soluție. Numele se rezolvă cu redirectări. Nu înțeleg care e problema cu formatele de la commons, dar dacă nu găsim o rezolvare le lăsăm așa (cu sedile).
Urmează să scriu și codul pentru sărit interwiki (n-am apucat încă). Oricum, e bine că avansăm, căci așa ne dăm seama de probleme.--Strainu (دسستي‎21 mai 2010 15:25 (EEST)Răspunde
Exemplu concret al problemei formatului Commons: {{commonscat|Beşiktaş J.K.}}. „ş”-ul trebui să rămână așa, neînlocuit (să fie sărit de roboți), pentru că numele este turcesc.Sebimesaj 21 mai 2010 15:32 (EEST)Răspunde
  Rezolvat. Vezi la articolul respectiv - merge cu span.Sunt ceva probleme cu soluția asta - posibil să vrem să sărim pur și simplu peste formate. O să notez problema și o să trec prin toate. La asta te refereai când ziceai "traducerile formatelor de la Commons"? Credeam că e vorba de cele de la imagini...--Strainu (دسستي‎21 mai 2010 15:39 (EEST)Răspunde
Nu, traducerile sunt altele: vezi categoria.Sebimesaj 21 mai 2010 15:49 (EEST)Răspunde
Alea vor rămâne așa (amestecate probabil). Va veni și vremea lor la un moment dat.--Strainu (دسستي‎21 mai 2010 16:18 (EEST)Răspunde

Cu cât mă gândesc mai mult, cu atât nu văd o problemă nici la parametrii formatelor cu virgulă - robotul care va modifica paginile va modifica și formatele, și apelul lor, deci toate vor fi cu virgulă.--Strainu (دسستي‎27 mai 2010 16:34 (EEST)Răspunde

În final da, dar întrebarea e ce se întîmplă dacă nu modifici simultan și pagina și formatul. În orice ordine ai face operațiile, va fi o perioadă cînd formatul nu va recunoaște parametrul. Nu cred că e o nenorocire, pentru că asemenea parametri cu sedilă sînt probabil foarte puțini, iar toată tranziția nu cred că va dura mai mult de cîteva zile. Dar era frumos dacă exista o soluție simplă încît să nu apară nici o problemă. (Pentru cazul particular cînd și titlul formatului conține o sedilă soluția e banală.) — AdiJapan 27 mai 2010 17:53 (EEST)Răspunde

Categoriile

modificare

Am mai adăugat o problemă la lista de lucruri de rezolvat: categoriile. Acestea nu pot fi redenumite, așa că trebuie duplicate și se va pierde istoricul lor. Categoriile inițiale pot fi păstrate (redirectate) sau șterse. Am făcut deja un robot care poate face acest lucru, mai rămâne doar să stabilim dacă vom șterge categoriile vechi. Eu propun să le menținem. Mutarea articolelor va fi făcută de către robotul ce va schimba textul articolelor, de aceea redenumirea trebuie făcută înainte de a activa orice script care să modifice conținutul articolelor.--Strainu (دسستي‎30 mai 2010 18:46 (EEST)Răspunde

Categoriile cu sedile în titlu trebuie păstrate cu redirect, din mai multe motive: pentru a nu fi recreate de cineva care scrie cu sedile, pentru a păstra istoricul, pentru ca să rămînă funcționale eventualele legături interne spre ele. Oricum, nu ne costă nimic să le păstrăm. — AdiJapan 30 mai 2010 19:35 (EEST)Răspunde

Schimbarea titlurilor

modificare

În afară de a cere drepturi de administrator pentru Strainubot, mai există vreun pas care ar trebui făcut înainte să trecem la modificarea titlurilor în așa fel încât să fie scrise cu virgule?--Strainu (دسستي‎30 mai 2010 18:46 (EEST)Răspunde

Strainubot are deja permisiunile de administrator setate. Nu cred că mai e nevoie de vreo operație pregătitoare. În schimb s-ar putea să fie nevoie de o operație după: repararea redirecturilor duble care vor apărea.
N-am nici o îndoială te-ai gîndit și singur, dar o spun să fie spus: paginile de utilizator (plus discuții și toate subpaginile create) nu trebuie mutate. Utilizatorii care și-au ales nume cu sedile vor trebui să ceară ei înșiși redenumirea conturilor dacă vor. — AdiJapan 30 mai 2010 19:47 (EEST)Răspunde
Parcă există deja roboți care repară redirectările duble. Oricum, o să rulez și eu scriptul respectiv.
Ai dreptate, trebuie excluse spațiile de nume Utilizator (+Discuție Utilizator), Categorie (dar discuțiile trebuie mutate aici) și Fișier (+Discuție Fișier). Altele?--Strainu (دسستي‎30 mai 2010 20:41 (EEST)Răspunde
Cu fișierele cum procedăm? O parte din fișiere sînt la Commons, deci legăturile spre ele trebuie lăsate așa cum sînt pînă li se schimbă numele acolo. În schimb cele de la noi am putea să le mutăm. Sau deocamdată pentru simplitate lăsăm toate fișierele cum sînt și nu schimbăm nici legăturile în text?
Alte excepții nu mai văd. Doar o întrebare: excepția cu lang="x-sic" funcționează și la titluri? E drept că s-ar putea să nu avem nevoie de ea decît foarte rar. — AdiJapan 31 mai 2010 05:45 (EEST)Răspunde
Fișierele ar trebui lăsate în pace cu robotul, e de departe cea mai simplă soluție. Marcajele de limbă funcționează și la titlu când pui {{titlu corect}}--Strainu (دسستي‎31 mai 2010 11:00 (EEST)Răspunde

Legat tot de titluri: cum procedăm atunci când cineva redenumește un articol introducând (fără să știe diferența dintre virgulă și sedilă) un caracter cu sedilă sau când cineva crează un articol nou, dar al cărui titlu conține sedile?Sebimesaj 31 mai 2010 16:22 (EEST)Răspunde

Rulăm robotul din când în când. Majoritatea articolelor noi cred că sunt făcute din linkuri, deci n-ar trebui să fie chiar o problemă mare pe termen lung.--Strainu (دسستي‎31 mai 2010 17:23 (EEST)Răspunde

În legătură cu redirectările duble: văd că deja au început să fie corectate.

În legătură cu titlurile de articolelor noi: putem edita MediaWiki:Newarticletext în așa fel încât să conțină un div invizibil cu textul Articolul pe care doriți să îl creați conține în titlu diacritice cu sedile. Este preferabil să creați articolul __NUME_CU_VIRGULE__ în schimb. Pentru amănunte vedeți Wikipedia:Diacriticele vechi și noi. Acest div ar urma să devină vizibil când detectăm sedile în titlu.--Strainu (دسستي‎1 iunie 2010 11:12 (EEST)Răspunde

Nedumeriri

modificare

Am observat că unii utilizatori nu înțeleg de ce articolele au fost redenumite și acționează în consecință. Cred că ar trebui să afișăm undeva un mesaj referitor la migrare.Sebimesaj 4 iunie 2010 15:49 (EEST)Răspunde

Da, n-ar strica un text în sitenotice cu o legătură la Wikipedia:Corectarea diacriticelor. Ai cumva timp să-l formulezi?--Strainu (دسستي‎4 iunie 2010 16:03 (EEST)Răspunde
O schiță: „Wikipedia în limba română se află în plin proces de înlocuire a diacriticelor cu sedilă cu cele cu virgulă, conform reglementărilor în vigoare.”Sebimesaj 4 iunie 2010 16:07 (EEST)Răspunde

Virgule forțate

modificare

Există vreo cale de a forța excepții la transformarea virgulelor în sedile? Mă gîndesc că uneori e nevoie de asta, de exemplu pentru testare (în paginile de explicații) sau ilustrare (în articole), inclusiv la aceia care și-au setat la preferințe afișarea cu sedile și la cei care automat primesc html-ul cu sedile. Chiar dacă ies pătrățele e bine ca utilizatorii / cititorii să poată vedea cum li se afișează literele cu virgulă.

Dacă nu există, mecanismul ar putea fi un span de tipul lang="ro" sau ceva mai precis lang="ro-virgule". Credeți că merită implementată excepția asta? — AdiJapan 5 iunie 2010 13:16 (EEST)Răspunde

Bineînțeles. Este spre binele celor care nu cunosc deosebirea dintre virgulă și sedilă.Sebimesaj 5 iunie 2010 15:26 (EEST)Răspunde
Se face deja acest lucru la afișare. În cazul căsuței de editare, nu cred că ar trebui făcute excepții - e important să fie văzute corect literele, și oricum vor fi convertite înapoi la salvare.--Strainu (دسستي‎14 iunie 2010 14:22 (EEST)Răspunde

Literele românești de sub fereastra de modificare

modificare

N-ar trebui schimbate în cele cu diacritice corecte?--Mycomp (discuţie) 6 iunie 2010 13:31 (EEST)Răspunde

Rezolvat. — AdiJapan 6 iunie 2010 15:36 (EEST)Răspunde

Nume si cuvinte romanesti pe Wiki in alte limbi

modificare

Este vreun plan pentru ce sa facem cu diacriticele de pe alte versiuni de Wikipedia? In principal en.wikipedia.org are foarte multe pagini care inca folosesc s- si t- cu cedilla pentru nume si cuvinte romanesti. Am modificat vreo doua (Florian Pittis, Stefan Banica), dar mi-am dat seama ca e practic imposibil de facut totul de mana.

Ma gandeam ca botul care muta paginile ar putea folosi legaturile inter-wiki (de genul [ [ro:Stefan Banica] ] pentru a determina paginile ce trebuiesc mutate pe alte wiki-uri. Bogdanb (nou) (discuție) 9 iunie 2010 12:22 (EEST) PS: Scuze pentru lipsa de diacritice din acest mesaj, intampin momentan ceva dificultati tehnice.Răspunde

Momentan nu este planificată o asemenea transformare pentru că este nerealist să implementăm artificiile tehnice de la ro.wp și la en.wp. Fără acestea, există tot felul de probleme de lizibilitate - aveți exemple aici sau la Cafenea. Oricum, în condițiile în care Windows XP are încă peste 50% din piață, vor fi încă multe articole scrise cu sedile de acum încolo.--Strainu (دسستي‎9 iunie 2010 18:41 (EEST)Răspunde

Timpul pentru adevărata sarcină...

modificare

Am terminat de mutat paginile și în afară de câteva probleme cu redirectările duble și cu scriptul de corectare automată nu am întâlnit probleme deosebite, dar și acestea se vor rezolva la sfârșitul procesului. Din câte știu, în prezent nu mai există utilizatori pentru care gadgetul să nu funcționeze. Mai rămâne să mai rulez odată scriptul de redenumire și să punem ceva la sitenotice și cred că putem trece la scrierea robotului de înlocuire.

Mă gândeam că în principiu acesta trebuie să arate exact ca scriptul de înlocuire. Rămâne de determinat metoda cea mai bună de minimizare a problemelor cu formatele, care vor exista cu siguranță. Nu știu dacă Gutza a apucat să scrie ceva cod, dacă nu mă voi apuca eu săptămâna aceasta.--Strainu (دسستي‎14 iunie 2010 14:36 (EEST)Răspunde

Nu am apucat să fac nimic, îmi pare rău. De fapt cred că e mai bine așa, fiindcă avusesem numai o fereastră destul de mică de timp să lucrez la asta, iar de terminat oricum nu apucam să termin -- mai mult te încurcam. --Gutza DD+ 14 iunie 2010 16:04 (EEST)Răspunde
Ar mai fi o problema, dar nu imi pot da seama din ce cauza a aparut... Oricum, am intalnit-o prin intermediul {{Reședințe de județ din România}}, unde majoritatea oraselor au fost mutate, exceptii fiind Brasovul si Constanta. Oare or mai fi astfel de situatii? -- Jokes Free4Me (discuție) 22 iunie 2010 19:09 (EEST)Răspunde
Se pare că deși are drepturi de administrator, Strainubot nu șterge redirectările cu istoric. Probabil că mai există și alte cazuri de genul acesta. În cazul în care le întâlnești, încearcă să faci tu redenumirea și dacă nu merge, scrie-le aici.--Strainu (دسستي‎22 iunie 2010 19:21 (EEST)Răspunde

Avand de efectuat o modificare intr-o pagina, are rost sa inlocuiesc manual toate numele din legaturi (care acum duc la redirecturi) catre pagina tinta, cu denumirea "corecta"? Sau sa fac doar modificarea "mea", sa las legaturile pentru cand va fi gata robotul de inlocuire? -- Jokes Free4Me (discuție) 22 iunie 2010 15:56 (EEST)Răspunde

Cum vrei, nu cred că există vreun motiv pentru care să preferi o variantă față de cealaltă. Ai putea încerca scriptul de transformare, vezi în secțiunea "Scripturi care vor funcționa în timpul tranziției". Din păcate nici eu n-am apucat să scriu la robot, dar încă mai are de lucru la redirectări, deci o să mai dureze un pic.--Strainu (دسستي‎22 iunie 2010 16:13 (EEST)Răspunde

A durat ceva mai mult decât am prevăzut să fac redirectările cerute de Ark mai jos, așa că de-abia în weekend voi începe tranziția. Azi și mâine voi testa robotul să văd cum se descurcă.

Ideea e să înceapă de la Formate: editează unul, apoi trece la paginile care includ formatul respectiv. în felul ăsta vom minimiza problemele legate de parametrii formatului. Aveți propuneri de formate cu care să-l testăm?--Strainu (دسستي‎1 iulie 2010 12:39 (EEST)Răspunde

Namespace

modificare

Tocmai am observat că spațiul de nume „Discuție Portal” conține încă „t” cu sedilă (vezi [12]). Din ce am văzut, nu mai există și alte spații de nume cu problema asta.Sebimesaj 14 iunie 2010 19:00 (EEST)Răspunde

Ba da, mai există: http://ro.wikipedia.org/wiki/Discu%C5%A3ie_Proiect:Economie.
Am impresia că este vorba de spațiile de nume create local, de noi.Sebimesaj 14 iunie 2010 19:04 (EEST)Răspunde
Redeschid bugul.--Strainu (دسستي‎14 iunie 2010 19:16 (EEST)Răspunde
  Rezolvat.Sebimesaj 4 iulie 2010 16:53 (EEST)Răspunde

Duplicare redirectări

modificare

Dacă s-a discutat chestiunea asta mai sus și nu găsesc eu, scuzele mele. Trebuie create redirectări de genul Caraș-Severin, clonă a redirectării Caraş-Severin. Sau, poate mai simplu, să redirecteze la Caraş-Severin, după care să fie rulat un robot ce corectează redirectări duble. —  Ark25  (discuție) 16 iunie 2010 16:24 (EEST)Răspunde

Adică să nu mai sar peste redirectări? Ok, încerc acum. --Strainu (دسستي‎16 iunie 2010 16:27 (EEST)Răspunde

Da, cred că e cel mai simplu să aplici exact același procedeu și pt redirectări. Am senzația că există destui roboți care corectează redirectările duble și care patrulează des. —  Ark25  (discuție) 16 iunie 2010 16:40 (EEST)Răspunde

Nu merge, voi mai analiza diseară de ce.--Strainu (دسستي‎16 iunie 2010 17:22 (EEST)Răspunde

Nu e grabă. —  Ark25  (discuție) 16 iunie 2010 17:24 (EEST)Răspunde

Actualizări iulie 2010

modificare

Am activat pentru toată lumea scriptul de corectare a diacriticelor (cu limitările legate de formate, până rulez roboții). De asemenea, în prezent redenumesc toate categoriile. Robotul pentru înlocuirea diacriticelor în articole este scris și urmează a fi rulat când se termină de redenumit categoriile.--Strainu (دسستي‎19 iulie 2010 14:23 (EEST)Răspunde

lipsește o tebelă cu descrierea technică

modificare

Exemple:

  1. Unicode Character 'LATIN SMALL LETTER S WITH CEDILLA' (U+015F)
    HTML Entity (decimal) &#351; · (hex) &#x15f; · UTF-8 (hex) 0xC5 0x9F (c59f) == %C5%9F
  2. Unicode Character 'LATIN SMALL LETTER S WITH COMMA BELOW' (U+0219)
    HTML Entity (decimal) &#537; · (hex) &#x219; · UTF-8 (hex) 0xC8 0x99 (c899) == %C8%99

O coloană co valuri nou / vechi nu strică. Mersi! ‫·‏לערי ריינהארט‏·‏T‏·‏m‏:‏Th‏·‏T‏·‏email me‏·‏‬ 22 iulie 2010 15:44 (EEST)Răspunde

Cred că și-ar găsi locul la WP:DVN, care ar trebui să prezinte diferențele dintre diacriticele vechi și noi. Dacă aveți timp, vă rog să o faceți.--Strainu (دسستي‎23 iulie 2010 23:45 (EEST)Răspunde
FYI: Actualmente București %C8%99 (oldid=4469966) conține numeroase variente Bucure%C5%9Fti. Am constatat că previzualizarea schimbă %C5%9F în %C8%99 automat. Nu am activat nici un "gadget". ‫·‏לערי ריינהארט‏·‏T‏·‏m‏:‏Th‏·‏T‏·‏email me‏·‏‬ 6 august 2010 02:48 (EEST)Răspunde
Știu, modificare aceea la previzualizare/salvare e metoda prin care și cei cu Windows XP vor putea să scrie cu diacriticele corecte fără să-și instaleze softuri suplimentare.--Strainu (دسستي‎6 august 2010 21:37 (EEST)Răspunde
;-)
‫·‏לערי ריינהארט‏·‏T‏·‏m‏:‏Th‏·‏T‏·‏email me‏·‏‬ 6 august 2010 20:47 (EEST)Răspunde
Mulțumim, îl voi integra la WP:DVN cât de curând.--Strainu (دسستي‎6 august 2010 21:37 (EEST)Răspunde

Cu plăcere. întrebări:

Exista recomandări ale guvenului, al academiei, ale Uniunii Europene etc. ?
Eu copiez diacriticile de la mesajele MediaWiki găsite aici. Sunt aceste mesaje normalizate?
pe wo.wiki si proiectele inrudite?
pe betawiki ( http://translatewiki.net/ ) ?

‫·‏לערי ריינהארט‏·‏T‏·‏m‏:‏Th‏·‏T‏·‏email me‏·‏‬ 6 august 2010 21:55 (EEST)Răspunde

Scuze pentru răspunsul întârziat. Există standarde, cele mai vechi sunt cu sedilă, cele mai noi cu virgulă. O listă (probabil) completă și mai multe informații puteți găsi la Secărică.
Pe TranslateWiki a rulat Siebrand un robot care a transformat toate mesajele din sedile în virgule. Sigur, există riscul ca persoanele care traduc mai departe să scrie cu sedile, dar nu sunt așa mulți.
În ceea ce privește mesajele particularizate pe ro.wp (din spațiul de nume MediaWiki), am rulat eu un robot de conversie, ar trebui să nu mai existe diacritice cu sedile. Dacă mai găsiți, e un bug și trebuie raportat :) La en.wp a creat cineva redirectări de la titlurile cu virgulă la cele cu sedilă. Mai mult vom face mai târziu. Am de gând să cer același lucru și la fr.wp.--Strainu (دسستي‎12 august 2010 22:21 (EEST)Răspunde

Istoricul categoriilor

modificare

Din nefericire, după „redenumirea” categoriilor în cauză s-a pierdut și istoricul lor, din câte se pare, iremediabil. Totuși, se poate cumva rezolva problema? Aflasem de o metodă de contopire a istoricului articolelor dar nu mi-a trecut prin cap să verific dacă se aplică și la categorii (din păcate nu mai găsesc linkul — ducea către o pagină de la en.wp).Sebimesaj 24 iulie 2010 15:32 (EEST)Răspunde

Nu, categoriile nu pot fi mutate, deci nici istoricul nu este disponibil.--Strainu (دسستي‎30 iulie 2010 23:41 (EEST)Răspunde

Alte probleme

modificare

Robotul ar trebui să modifice și redirecționările către secțiuni ale paginilor, precum aceasta (vezi modificarea). De asemenea va trebui să umble și pe paginile de discuții, întrucât unele formate sunt funcționale doar acolo (spre exemplu: {{Proiect ȚL}}).Sebimesaj 30 iulie 2010 22:34 (EEST)Răspunde

Din păcate, am descoperit că au fost modificate și legăturile către alte proiecte românești (cum ar fi Wikționar, Wikisursă etc.) care nu folosesc încă diacriticele corecte. Astfel, linkurile ce conțin „ș” sau „ț” au devenit inutile.Sebimesaj 30 iulie 2010 22:37 (EEST)Răspunde
No can do pentru secțiuni, va trebui implementat de mână. Mai exact, no can do pentru redirectări. O să-l pun să editeze pe paginile de discuție ale articolelor, dar doar la sfârșit, individual și nu și pentru alte spații de nume. E foarte periculos să editezi opiniile oamenilor fără supraveghere. Paginile de discuție vor fi editate de javascript și vor fi modificate, dar plec de la presupunerea că erori introduse astfel vor fi observate ușor.
Exemple pentru alte proiecte te rog, fără exemple nu pot face nimic.--Strainu (دسستي‎30 iulie 2010 23:41 (EEST)Răspunde
De pildă, modificarea asta pe portalul Știință a cauzat ruperea legăturii Știință, pentru că a înlocuit diacriticele (a rezultat Știință).Sebimesaj 31 iulie 2010 00:05 (EEST)Răspunde
S-ar putea totuși să nu fie vina robotului.Sebimesaj 31 iulie 2010 00:08 (EEST)Răspunde
Cu siguranță nu e vina robotului. Problema e că acolo se folosește numele paginii. Voi încerca să modific formatul cumva săptămâna viitoare, dar dacă cineva are idei, formatul este Format:WikimediaPentruPortale.
În ceea ce privește redirectările, se pare că se poate modifica, vezi [13], care avea prima diacritică bună. O trec pe listă, să văd cum se poate face.
Dacă mai găsești probleme, nu ezita să le menționezi.--Strainu (دسستي‎31 iulie 2010 00:19 (EEST)Răspunde

Ar mai fi ceva: la început, robotul modifica și descrierile fișierelor din articole (dar și numele său în cazul în care conținea „ș” sau „ț”), dar acum nu o mai face, chiar dacă ai rezolvat ingenios problema titlurilor, prin redirecționări. Nu de alta, dar tot trece pe acolo și e păcat să nu modifice.

În altă ordine de idei, nu știu de ce aicinu a înlocuit toate diacriticele (vezi modificarea mea).Sebimesaj 31 iulie 2010 15:03 (EEST)Răspunde

La fișiere tocmai asta e problema - modifica și numele fișierului și lumea s-a plâns. E drept, numai când scria FILE sau IMAGE (în engleză), dar se pare că lumea dă copy-paste la greu de pe commons. Acum nu se schimbă nimic din [[Fișier:]], orice ar fi după două puncte. Există o infinitate de combinații posibile pentru plasarea descrierii la fișiere (vezi de exemplu codul pentru fișierul ăsta pentru o plasare non-standard) și nu știu cum aș putea identifica descrierea în mod corect fără testa toate posibilitățile, ceea ce e inacceptabil dpdv al performanței. Dacă vine cineva cu o idee, sunt dispus să o încerc.
La comenzi rapide, el identifică [[WP:ȘR]] drept interwiki. Un compromis de dragul performanței, absolut nesemnificativ după părerea mea.--Strainu (دسستي‎31 iulie 2010 16:59 (EEST)Răspunde
 
Ceva

Nu schimbă nimeni diacriticele din pagina asta (pagina, nu discuția despre ea)?

modificare

Nu schimbă nimeni diacriticele din pagina asta (pagina Wikipedia:Corectarea_diacriticelor , nu discuția despre ea)?

2) ar trebui puse si instructiuni pt oricine vrea sa redacteze text in Romana despre cum se pot folosi literele cu virgula sub ele, in versiunile curente de Windoze (de la XP in sus), Linux si MacOS, precum si pe diversele dispozitive portabile raspandite (iPhone/iPodTouch, Android, symbian, PalmOS).

3) pt a evita convertirea unor cuvinte din turcă, se poate adauga si o regula cu dictionare; de asemenea una cu litere ne-românești (un astfel de cuvant nu are ce cauta cu ș-virgulă, daca contine ö sau ü sau g-caciula, sau i fara punct. De asemenea un cuvant cu ț e sigur românesc.

4) si daca din greseala convertim un cuvant turcesc, nu e mare paguba. E mai nasol invers, fiind mult mai probabil sa intalnim un cuvant romanesc intr-o pagina scrisa in romaneste :-) . Acest comentariu nesemnat a fost adăugat de 76.10.155.55 (discuție • contribuții).

1. Diacriticele sînt schimbate de un robot, care ia paginile la rînd. Nu facem înlocuirea de mînă.
2. Sfaturi tehnice despre diacritice se găsesc la Wikipedia:Diacritice. E drept că pagina ar trebui actualizată.
3. Pentru a evita convertirea cuvintelor turcești preferăm să le marcăm manual (vedeți explicațiile). O identificare și marcare automate ar putea fi utilă, dar nu avem o listă cu toate numele turcești posibile.
4. Foarte mare pagubă nu e nici într-o direcție nici în alta. Dar dacă tot facem o chestie preferăm s-o facem bine.
5. Scriem despre diacritice fără diacritice?... — AdiJapan 12 august 2010 09:48 (EEST)Răspunde

Ajutor Urgent!

modificare

Salut!

Ma numesc Robert si impreuna cu KlaudiuMihaila sunt adminstrator si unul dintre cei mai activi pe Wiktionarul roman. Mi-am smuls parul de pe cap din cauza farsei/circului care se desfasoara pe scena birocratiei limbii romane. Nu pot intelege, nu imi place si am foarte greu sa accept aceasta ridicola birocratie despre "s" si "t" cu sedila sau virgula.


Eu inteleg ca nu este din cauza dumneavoastra si nu va acuz pentru aceasta! Deoarece eu nu am cunostiintele adecvate in domeniul programarii, eu nu pot crea un bot care intr-un mod simplu inlocuieste actualele "s/t" scrise cu sedila, cu "s/t" scrise cu virgula. Eu refuz sa execut schimbarile necesare in mod manual, deoarece avem peste 11000 de cuvinte in limba romana si 39000 de articole in total cu afiliere la limba romana.


Exista cineva cunoscator in programare care ma poate ajuta in aceasta problema acuta? Imi este teama ca celalalte Wiktionare (englez, francez, italian, etc.) au doar cuvinte romane cu sedila. Este o munca enorma a schimba otrografia pentru a putea uni si identifica cuvintele si articolele care exista pe Wiktionarele diferite, mai ales pentru ca articolul "șapte" (cu sedila) nu are aceiasi legatura ca articolul "șapte" (cu virgula) in Wiktionar.


Sunt infricosat si completamente disperat! Atata munca, timp, bunavointa si entuziasm care s-au investit sunt in pericol sa dispara.


Sper ca ma intelegeti si ca ma puteti ajuta!


--Robbie SWE (discuție) 22 august 2010 15:52 (EEST)Răspunde

Bună ziua. Cu siguranță că vă putem ajuta, dar eu unul nu am înțeles prea bine ce doriți să faceți. Vreți să treceți și la Wikționar la diacriticele cu virgulă? Dacă da, vă pot ajuta cu cea mai mare plăcere. Dacă aveți alt fel de probleme cu trecerea la diacriticele cu virgulă pe Wikipedia, precizați-le și vom încerca să le rezolvați. Noi toți cei implicați în discuțiile de aici am făcut tot posibilul ca celelalte proiecte să nu fie afectate, însă sigur că au mai fost și scăpări.--Strainu (دسستي‎22 august 2010 22:34 (EEST)Răspunde

Altă problemă

modificare

Am descoperit un lucru interesant, în cazul formatelor.

Cutie canton folosește un parametru integrat în denumirea imaginii („[[Image:'''<u>{{{locaţie în elveţia}}}</u>'''|190px|none|Cantonul {{{nume}}} pe harta Elveției]]”), dar, după cum se cunoaște, Strainubot a evitat sintagmele ce implicau fișiere, lăsându-le nemodificate, așa cum a procedat și în cazul de față. Nu cunosc câte formate au această problemă, însă, cu siguranță, articolele sunt afectate.Sebimesaj 29 august 2010 18:58 (EEST)Răspunde

Sunt probabil multe formate care ascund spatiul de nume al imaginilor, ceea ce s-a dovedit a fi o idee dezastruoasă. În cazul problemei ăsteia, soluția a modificarea formatului.
Mai rămâne problema fișierelor de la commons, către care nu se pot face redirectări de aici. Am cerut drepturi de bot ca să creez redirectări acolo, dar nu știu încă mai multe. Până atunci, dacă nu merge o imagine, creați manual redirectările de la virgulă la sedilă la commons.--Strainu (دسستي‎29 august 2010 19:11 (EEST)Răspunde
Și în cazul fișierelor am o obiecție: dacă titlul unei imagini conține diacritice vechi, iar în articole se folosește varianta cu glifele corecte, atunci, în secțiunea „Legături” a paginii de descriere a fișierului, nu se mai afișează respectivele articole. Eu folosesc aceste detalii atunci când, de exemplu, doresc să șterg un fișier sau să-l înlocuiesc cu altul. Personal nu văd vreo rezolvare tehnică (locală, cel puțin), ci mai degrabă reîncărcarea (automată) fișierelor. Acum depinde dacă tu o consideri o problemă cu o rezolvare prioritară sau nu.Sebimesaj 29 august 2010 19:20 (EEST)Răspunde
Nu este fezabilă reîncărcarea fișierelor. Vorbim de zeci de mii de fișiere la care s-ar pierde istoricul. Folosește legătura Ce trimite aici așa cum faci la articole, pagina aia știe și de redirectări.--Strainu (دسستي‎29 august 2010 23:58 (EEST)Răspunde
Dacă e vorba de cele locale, în total la ro.wp sunt cam 37000 de imagini, din câte cred că foarte puține (poate de ordinul sutelor — zic și eu off the top of my head) cred să conțină diacritice ș/ț în nume. În Pywikipediabot există o funcționalitate de extracție a istoricului de la original și includere în fișierul reuploadat, funcționalitate foarte utilă pentru reîncărcarea fișierelor la Commons. —Andreidiscuție 30 august 2010 00:17 (EEST)Răspunde
Interesant, nu știam de această posibilitate. Am exagerat cu zecile de mii, îmi rămăsese în cap faptul că la commons a fost făcută o propunere oarecum asemănătoare. La noi sunt în jur de 1800 de fișiere în această situație. Totuși eu nu sunt convins că redenumirea ar rezolva problema. Din moment ce în acest moment comportamentul implicit e să nu ne atingem de fișiere, cred că ar fi mai rău să le redenumim, căci ar rămâne referințele la adresa cu sedilă. Pentru fișierele noi oricum nu mai este permisă decât denumirea cu virgulă, deci n-ar trebui să avem asemenea probleme.--Strainu (دسستي‎30 august 2010 00:49 (EEST)Răspunde
  1. În altă ordine de idei, cum se rezolvă problema paginilor speciale care conțin (încă) diacritice vechi: Special:Preferințe, Special:Contribuții etc.? Am crezut că problema se va rezolva de la sine prin rularea robotului, atât local, cât și la translatewiki.net, dar se pare că nu-i așa.Sebimesaj 30 august 2010 15:00 (EEST)Răspunde
  2. Ce se întâmplă cu utilizatorii care au în numele lor de utilizator diacritice cu sedilă? Robotul modifică și numele de utilizator, inclusiv pe cele care conțin diacritice (vezi cazul lui Mușatin).
  3. Ar putea rula Strainubot în paginile de discuții ale articolelor în care se găsesc formate de tipul {{Proiect ȚL}} sau {{IstoricArticol}}, modificând doar parametrii, nu și alte discuții ale utilizatorilor?Sebimesaj 30 august 2010 21:56 (EEST)Răspunde
  1. Așteptăm să își găsească cineva timp de noi: bugzilla:24951. Puteți vota bugul :P
  2. Nu se întâmplă nimic, numele trebuie marcate. Dacă utilizatorii doresc, bănuiesc că se pot face redirectări. Oricum exemplele de utilizatori cu contribuții și sedile sunt mult prea rare...Dacă vor mai apărea, s-ar putea lua în calcul introducerea numelor de utilizator pe lista de excepții.
  3. Nope. Am modificat formatele ca să meargă și cu diacriticele vechi.--Strainu (دسستي‎30 august 2010 22:52 (EEST)Răspunde

Pagini de șters

modificare

Sesizare: la Wikipedia:Pagini de șters, nu trebuiau înlocuite diacriticele din numele paginilor. Astfel, la Wikipedia:Pagini de șters/Euro Piața, dacă dai click pe linkul roșu, mergi la Euro Piața, nu la Euro Piaţa, care pentru administratori, este o pagină ștearsă cu istoric. Observația este totuși una minoră, nu cred că această chestiune poate fi o problemă, dar poate există și alte cazuri asemănătoare, și atunci ar putea fi utilă. —  Ark25  (discuție) 11 septembrie 2010 06:58 (EEST)Răspunde

Propunere pentru o nouă metodă de determinare a calculatoarelor cu fonturi gresite

modificare

Pe grupul traducătorilor de open source a apărut o propunere de javascript care determină dacă un utilizator poate afișa diacriticele corecte pe baza comparației între lățimea stringurilor "șțȘȚ" și "stST" scrise cu fontul fără serife implicit (cel folosit și la Wikipedia). Dacă fontul e ok, lățimea ar trebui să fie egală, dacă nu, ea va varia, caz în care se va face înlocuirea cu diacriticele cu sedile.

Codul este disponibil aici (partea interesantă e de la function DiacriticsOnOlderOperatingSystems în jos).

Avantaje
  • identifică mult mai bine utilizatorii care nu pot vedea perfect diacriticele
  • ține cont de motoarele de căutare, cărora le prezintă varianta cu virgule
Dezavantaje
  • le răpește oamenilor care văd decent diacriticele corecte posibilitatea de a citi textul cu virgule dacă doresc acest lucru
  • împiedică funcția de leader a Wikipedia în implementarea diacriticelor corecte; practic cu diacritice corecte vor vedea doar cei care le văd perfect

Aștept opinii.--Strainu (دسستي‎12 noiembrie 2010 17:09 (EET)Răspunde

Toată filosofia Wikipedia este îndreptată împotriva ideii de a fi lideri în orice domeniu (cunoaștere sau tehnologie). Dimpotrivă, Wikipedia trebuie să asigure cel mai mic numitor comun dintre toate tehnologiile disponibile (de-asta conținutul nu depinde de JavaScript sau Flash). Deci al doilea dezavantaj de fapt nu există. Cât despre primul, sunt convins că se poate scrie un gadget care să dezactiveze funcționalitatea respectivă dacă vor exista voci care să ceară cu tot dinadinsul așa ceva (deși m-aș foarte mira să apară astfel de voci). Prin urmare eu nu cred că există vreun dezavantaj real, ci numai avantaje. --Gutza DD+ 12 noiembrie 2010 18:15 (EET)Răspunde
Nu sunt de acord cu tine, dar asta nu e ceva nou :)
Am făcut schimbarea, vă rog să raportați eventualele erori. Nu o voi mai anunța la Cafenea pentru că teoretic ar fi trebuit să nu se simtă trecerea.--Strainu (دسستي‎17 noiembrie 2010 16:35 (EET)Răspunde
 

Se pare că script-ul funcționează corect: pe un telefon HTC Desire (cu Android 2.2), sunt înlocuite diacriticele cu virgulă cu cele cu sedilă, atât timp cât nu fac parte dintr-un <span lang="ro"> (vezi imaginea din dreapta). E o chestie destul de bizară cu fonturile acestui telefon: nu sunt afișate corect ț-urile cu virgulă (apar pătrățele), deși ș-urile cu virgulă sunt afișate corect (cu virgulă), ş-urile cu sedilă sunt afișate corect (cu sedilă), însă ţ-urile cu sedilă sunt afișate cu virgulă. Oricum, script-ul face diacriticele să fie afișate într-o manieră acceptabilă (deci îți mulțumesc că l-ai instalat). Răzvan Socol mesaj 2 decembrie 2010 12:10 (EET)Răspunde

În varianta inițială exista și o variantă "semidiacritice" special pentru ciudățeniile fonturilor Droid. Din ce-am înțeles înlocuia doar ț, nu și ș. Necesita însă ceva schimbări suplimentare în cod și mi-a fost cam frică să-l implementez. Mai e și problema trecerii în altă aplicație - ajungi să ai diacritice amestecate și nu prea știi cum se comportă. Oricum, dacă îl consideri util și ai timp să îl bibilești, te rog. Codul e la MediaWiki:Diacritice.js--Strainu (دسستي‎2 decembrie 2010 12:42 (EET)Răspunde

Tag-ul span între nowiki sau în comentarii

modificare

Am observat o chestie bizară la comportamentul gadget-ului care corectează diacriticele introduse: tag-urile <span lang="ro"> şi </span> sunt luate în considerare chiar dacă sunt cuprinse în tag-uri <nowiki> sau în comentarii HTML (<!-- ... -->). Vezi [14] și [15]. Cuvântul "pătrățele" din mesajul anterior a fost lăsat cu diacriticele cu virgulă (așa cum a fost scris), deoarece apărea după un tag <span lang="ro">, dar care era scris într-un tag <nowiki>. La fel s-a întâmplat şi cu celelalte diacritice până la tag-ul <span lang="tr">. Atunci când am adăugat un <!-- </span> -->, a fost luat în considerare ca sfârșit al tag-ului precedent (chiar dacă acesta era comentat) și a corectat diacriticele de la cuvântul "pătrățele", scriindu-le cu virgulă. Răzvan Socol mesaj 2 decembrie 2010 12:25 (EET)Răspunde

Redirecționări către fișiere

modificare

Există anumite redirecționări către fișierele de la Commons, cum ar fi aceasta. Problema apare în articole (vezi Rugășești, Cluj), atunci când în infocasetă este utilizat fișierul precizat anterior (adică cel redirecționat), acesta nefiind afișat (se afișează doar o legătură, nu și fișierul). Dacă încerc să schimb numele care să conțină vechile diacritice, intră în acțiune gadgetul auto-diacritice. Ce se poate face?Sebimesaj 20 decembrie 2010 23:36 (EET)Răspunde

Teoretic, s-ar putea folosi un tag <span>, dar nu cred că e cea mai bună soluție. Răzvan Socol mesaj 21 decembrie 2010 13:50 (EET)Răspunde
Nu merge cu span din păcate - în multe formate se introduce doar numele fișierului, fără spațiu de nume, care este adăugat ulterior; soluția este crearea de redirectări la commons sau rescrierea scripturilor (în cazul infocasetelor mi-am recunoscut neputința de mult). Redirectările locale către fișiere de la commons nu merg, redirectarea respectivă fusese făcută înainte de a fi mutat fișierul.--Strainu (دسستي‎21 decembrie 2010 16:25 (EET)Răspunde

Posibil bug

modificare

Sper să nu fie alarmă falsă. Tocmai am creat pagina Listă de publicații de investigații din România, pe care ulterior am mutat-o la Listă de publicații de investigații din România. Nici nu știu unde am scris cu sedilă în loc de virgulă, pentru că browserul îmi arată numele paginii ca având diacritice cu virgulă. Presupun că javascripturile trebuiau să corecteze titlul direct în versiunea corectă. Dacă nu trebuiau să facă chestiunea asta, atunci cum puteam să mă asigur că am scris titlul cu diacritice corecte? Pentru că am descoperit că ceva nu e în regulă din întâmplare. —  Ark25  (discuție) 13 aprilie 2011 04:22 (EEST)Răspunde

Depinde cum ai creat pagina. Javascriptul acoperă câteva cazuri (rezultate de căutare, legături interne), dar e posibil să fi scăpat ceva. Îmi poți spune exact cum ai procedat?
Ca să îți dai seama dacă linkul e corect sau nu, te uiți ori în bara de adrese, ori plasezi mausul pe legătură și îți apare adresa în partea de jos a ecranului.--Strainu (دسستي‎13 aprilie 2011 14:00 (EEST)Răspunde
Eram la pagina Listă de publicații despre media din România. Am mers în bara de adresă (Alt+D), și în loc de "media" am scris "investigații". Am dat "enter", nu a găsit pagina, bineînțeles, și am mers la "Puteți crea pagina". Probabil că scriptul nu te poate ajuta dacă ai scris numele cu alte diacritice - de fapt așa ar cam trebui să fie, să te lase să pui în titlu diacriticele pe care le vrei. În fine, când voi avea dubii, o să creez într-un sandbox o wiki-legătură către pagină și atunci voi vedea dacă e în regulă. —  Ark25  (discuție) 14 aprilie 2011 10:26 (EEST)Răspunde
A, da, acea metodă de creare a paginilor nu e acoperită de niciun cod. N-ar fi mare lucru să scriu cod pentru asta, dar nu știu cum e mai bine: să forțăm sau nu diacriticele corecte și de acolo, iar dacă se doresc diacritice turcești, să se facă redirectare ulterior, sau să presupunem că utilizatorul știe ce face. Oricum, preventiv voi rula din nou robotul diseară, să vedem peste câte pagini cu sedilă mai dăm.--Strainu (دسستي‎14 aprilie 2011 12:01 (EEST)Răspunde

O variantă ar fi să te întrebe dacă vrei neapărat ca titlul să rămână cu sedile, așa cum l-ai scris. E cea mai bună variantă pentru cei cu experiență. Dar pentru noii veniți ar putea fi derutant. Probabil că deocamdată cea mai bună variantă ar fi verificarea periodică a titlurilor scrise cu sedilă (odată la 3-6 luni), și extragerea de concluzii din situațiile indicate de verificări. —  Ark25  (discuție) 14 aprilie 2011 23:07 (EEST)Răspunde

Verificare automată a redirectărilor

modificare

Goleşti ar trebui să redirecteze la Golești. Poate că ar fi utilă o verificare automată pentru detectarea unor asemenea inconsistențe. Acolo unde pagina cu ș corect este o redirectare, cea cu ș cu sedilă ar trebui să fie identică cu ea, adică aceeași redirectare. —  Ark25  (discuție) 21 iulie 2011 00:09 (EEST)Răspunde

Păi asta se întâmpla și acolo până s-a decis cineva să facă o pagină de dezambiguizare :P În fine, e o idee bună, scrie-o te rog și la Wikipedia:Sarcini pentru roboți și voi încerca să mă ocup ceva mai la toamnă, după ce termin cu concursul foto.--Strainu (دسستي‎21 iulie 2011 00:33 (EEST)Răspunde

Un "form" (formular) pentru crearea de redirecturi

modificare

Tocmai am creat pagina Ștevie. Vroiam să fac și Pagina de redirectare ştevie. Nu reușesc să produc un ș cu sedilă nicicum. Până la urmă am găsit în Discuție Wikipedia:Corectarea diacriticelor#Nume turcești textul <span lang="x-sic">[[Timiş]]</span>, și așa am făcut rost de un ș cu sedilă. Ar fi util un formular în care introduc numele paginii pe care tocmai am creat-o (Ștevie în cazul acesta), și care să-mi prezinte legătura cu roșu (ştevie), ca să pot face redirectul. Sau, poate mai bine, sub caseta de editare, lângă diacriticele incorecte(Diacritice incorecte: Ş ş Ţ ţ) , să am un buton care să producă <span lang="x-sic"></span>. —  Ark25  (discuție) 29 noiembrie 2011 18:54 (EET)Răspunde

Ai încercat formularul de la Schimbări recente sau cel de pe pagina principală? :) Teoretic ar trebui să fie și ele acoperite de scriptul de conversie, dar văd că nu sunt. Nu știu ce să zic despre introducerea de chestii noi în mediaWiki:Edittools, ideea ar fi fost să se renunțe la aia pentru toolbarul cel minunat din Vector. Poate că ar fi bine să adăugăm un buton în toolbar?--Strainu (دسستي‎29 noiembrie 2011 19:23 (EET)Răspunde
Nu știu la ce te referi prin „Vector”. Dar oricum, ce sens mai are să avem în toolbar ș și ț cu sedilă, din moment ce la prima previzualizare se transformă în ș și ț cu virgulă? Ca să le pot copia și să le folosesc în afara Wikipedia? Dacă tot sunt puse acolo, atunci ar fi normal să existe un buton și pentru < span >, ca să le poți folosi în paginile Wikipedia. —  Ark25  (discuție) 29 noiembrie 2011 20:00 (EET)Răspunde

Vector e numele skinului cel nou, iar diacriticele sunt deja toate în toolbar, ar urma să adăugăm numai o legătură pentru <span>--Strainu (دسستي‎29 noiembrie 2011 22:39 (EET)Răspunde

Până se decide schimbarea skinului cu Vector, pune te rog buton pentru "span" în toolbarul actual. Presupun că nu are nimeni vreo problemă cu asta. —  Ark25  (discuție) 30 noiembrie 2011 17:25 (EET)Răspunde
Am adăugat eu. —  Ark25  (discuție) 9 decembrie 2011 07:45 (EET)Răspunde

Spațiu de lucru

modificare

Ar fi bine să avem undeva un spațiu de lucru folosit în comun, unde să putem completăm conținut de genul acesta Pagini ce conțin ţ cu sedilă în titlu. Asemenea pagini trebuiesc avute în vedere pentru redenumire (paginile aflate în stânga trebuie redenumite numele din dreapta). Cred că ar fi bine de monitorizat asemenea cazuri de pagini. —  Ark25  (discuție) 23 ianuarie 2012 10:04 (EET)Răspunde

Dacă poți să ții actualizat Wikipedia:Corectarea diacriticelor/titluri cu sedilă în care să pui toate titlurile greșite (și doar cele greșite), pot să rulez zilnic robotul de mutare.--Strainu (دسستي‎23 ianuarie 2012 11:38 (EET)Răspunde
Odată pe lună e mai mult decât suficient. O listă nouă pot produce maxim odată la opt zile, când se face un nou backup. Ar fi util dacă robotul poate raporta unde nu a putut face redenumirea pentru a redenumi paginile manual. Exemplu: Studiniţa, Olt ==> Studinița, Olt, care are istoric. Dacă nu, atunci oricum vom depista articolele respective. —  Ark25  (discuție) 24 ianuarie 2012 00:59 (EET)Răspunde
Am făcut și o listă cu articolele care conțin ş cu sedilă în titlu dar trebuie păstrate așa, pentru că sunt nume turcești. Utilizator:Ark25/Diacritice/ş turcesc Ark25  (discuție)
OK, o să-l configurez la 14 zile atunci. În ceea ce privește Utilizator:Ark25/Diacritice/ş turcesc, poți să te ocupi tu de pus {{titlu corect}} sau vrei să scriu eu codul? Întreb pentru că nu-mi dau seama cât de greu/ușor ți-ar fi în comparație cu mine, care trebuie să scriu vreo 20-30 de linii de cod pentru asta :)--Strainu (دسستي‎24 ianuarie 2012 08:43 (EET)Răspunde

Păi văd că formatul este folosit deja în paginile respective. Exemplu: Kırşehir, Afşin. O să le verific pe toate. E mai simplu de făcut manual, articole despre Turcia se fac destul de rar. —  Ark25  (discuție) 24 ianuarie 2012 09:46 (EET)Răspunde

Ağdaș n-avea, d-aia întrebam.--Strainu (دسستي‎24 ianuarie 2012 11:14 (EET)Răspunde
Am rulat robotul, rezultatele sunt la Discuție Wikipedia:Corectarea diacriticelor/titluri cu sedilă. Va rula de acum pe 15 ale fiecărei luni.--Strainu (دسستي‎24 ianuarie 2012 23:32 (EET)Răspunde

Mai erau două orașe turcești fără formatul {{titlu corect}}, le-am rezolvat. Presupun că rezultatele sunt afișate pentru că trebuiesc rezolvate manual, nu? Exemplu:

. —  Ark25  (discuție) 29 ianuarie 2012 18:59 (EET)Răspunde

Da, cele afișate trebuie rezolvate manual.--Strainu (دسستي‎29 ianuarie 2012 19:26 (EET)Răspunde

@Strainu:

Alte spații de nume

Am găsit următoarele formate cu nume ce conțin caractere cu sedilă: Format:Câini ciobăneşti şi utilitariFormat:Câini de pază şi protecţieFormat:Country alias Antigua şi BarbudaFormat:FC BraşovFormat:Liga a IV-a BucureştiFormat:Şr-a11

Unele dintre ele sunt în dublu exemplar, altele nu există: Format:Câini ciobănești și utilitariFormat:Câini de pază și protecțieFormat:Country alias Antigua și BarbudaFormat:FC BrașovFormat:Liga a IV-a BucureștiFormat:Șr-a11

De asemenea, am făcut o listă cu categorii care conțin caractere cu sedilă în nume - Wikipedia:Corectarea diacriticelor/titluri cu sedilă - categorii. Lista este dublată de numele corecte, după cum se vede acolo din legăturile roșii, există vreo câteva zeci care lipsesc. Probabil că atunci când au fost create automat, robotul a sărit peste ele din cauza conexiunii proaste. Altele au fost create ulterior și din cauza aceea nu sunt făcute redirect spre varianta cu numele corect. —  Ark25  (discuție) 28 octombrie 2014 09:33 (EET)Răspunde

Lista de categorii e inutilizabilă - nu e numai cu diacritice vechi și majoritatea sunt oricum categorii de redirecționare (deci corecte). În ceea ce privește formatele, se rezolvă manual...--Strainu (دسستي‎28 octombrie 2014 10:13 (EET)Răspunde
Jumătatea a doua conține categoriile redenumite cu diacritice corecte. Unele dintre ele sunt roșii. Exemple: Categorie:Regiuni istorice și teritorii SUA vs. existenta Categorie:Regiuni istorice şi teritorii SUA sau Categorie:Orașe în comitatul Komárom-Esztergom vs existenta Categorie:Oraşe în comitatul Komárom-Esztergom - în acest al doilea caz, robotul a creat redirect către categoria cu diacritice noi, dar categoria cu diacritice noi nu a mai fost creată. —  Ark25  (discuție) 28 octombrie 2014 21:05 (EET)Răspunde
Ba a fost creată, doar că dintr-un motiv oarecare Andrei Stroe a redirect către varianta cu sedilă, Wintereu l-a propus pentru ștergere rapidă pentru că era o redirecționare în cerc și eu am șters-o fără să fiu foarte atent la tot istoricul. Am revenit la varianta corectă.--Strainu (دسستي‎28 octombrie 2014 21:24 (EET)Răspunde
Bun, atunci rămân categoriile care au nume sedilă și care sunt categorii de redirecționare. Ele ar trebui să aibă duplicate cu nume corecte. Exemple: Categorie:BelaruşiCategorie:Belaruși sau Categorie:Orașe în OregonCategorie:Oraşe în Oregon. Cred că acestea sunt categoriile care, la momentul corectării diacriticelor, erau deja categorii de redirectare și probabil că robotul a sărit peste ele. —  Ark25  (discuție) 31 octombrie 2014 05:48 (EET)Răspunde

Redirectări greșite

modificare

Comuna Dognecea, Caraş-Severin nu redirectează la Comuna Dognecea, Caraș-Severin, așa cum ar trebui. Poate mai sunt și alte asemenea pagini în aceeași situație. Oare pot fi depistate automat? —  Ark25  (discuție) 4 aprilie 2013 14:00 (EEST)Răspunde

Comuna Domneşti, Argeş redirectează către Domnești, Argeș, în loc să redirecteze către Comuna Domnești, Argeș. —  Ark25  (discuție) 25 iunie 2013 03:35 (EEST)Răspunde
Am făcut o listă cu toate redirectările greșite la Utilizator:Ark25/PR4/TEMP - 1372 de pagini. —  Ark25  (discuție) 11 august 2013 14:00 (EEST)Răspunde

Alte titluri greșite

modificare

Numele articolului Gheorghe Tătărеscu este scris cu „e” chirilic - en:Ye (Cyrillic). Mai precis, e-ul din „Tătărеscu”. Cine știe câte alte articole conțin în titluri litere chirilice care arată exact ca cele latine. —  Ark25  (discuție) 20 iunie 2013 00:17 (EEST)Răspunde

Am corectat. Am verificat și câte articole conțin în titluri litere chirilice.. nu chiar multe. Există o unealtă care găsește articole pe baza expresiilor regex. Pentru a afla lista articolelor care conțin litera chirilică «a» în titlu, am folosit http://toolserver.org/~nikola/grep.php?pattern=%5E%28%28.%29*%29%D0%B0%28%28.%29*%29%24&lang=ro&wiki=wikipedia&ns=0&redirects=on //  Gikü  vorbe  fapte  joi, 20 iunie 2013 00:50 (EEST)Răspunde

Înlocuire diacritice în editorul vizual

modificare

În cadrul hachathonul de la Wikimania am recrutat niște oameni și am pregătit un demo despre cum ar putea funcționa corectarea diacriticelor pentru editorul vizual.

Aș vrea să vă rog să-l testați. M-ar interesa:

  • greșeli (nu înlocuiește tot, nu înlocuiește unde trebuie etc.)
  • probleme de performanță (mă aștept să apară în acest moment): blocări, crashuri etc. - calculatoarele mai slabe ar ajuta
  • cât mai multe browsere și sisteme de operare (eu am la dispoziție doar un Chromebook momentan)
  • erori prin consolă

Ca să-l activați, introduceți linia de mai jos în acest fișier:

importScript('Utilizator:Strainu/ve.js');

ATENȚIE! Momentan scriptul are extrem de multe limitări și NU trebuie folosit în producție (adică în articole):

  • nu identifică niciun fel de marcaj folosit în versiunea clasică
  • înlocuirea are loc la fiecare eveniment (apăsare de tastă), ceea ce va duce la probleme de performanță pe calculatoare mai slabe
  • nu funcționează decât pentru textul propriu zis din pagini, nu și pentru descrierea imaginilor sau parametrii formatelor; asta e o limitare din Visual Editor nu știu încă dacă poate fi rezolvată

Folosiți-l doar în spațiul utilizator!

--Strainu (دسستي‎18 iulie 2015 22:46 (EEST)Răspunde

Înapoi la pagina de proiect „Corectarea diacriticelor”.