10º Aniversário da Wikipédia Lusófona

May 11th, 2011 ntavares Posted in lazer, pt_PT, web, wikipedia No Comments »

Ouvir com webReader

200px-10yrs-contributing_k-text-pt-whitesvg
Já saíram os resultados do 8º WikiConcurso, realizado a propósito do 10º Aniversário da Wikipédia lusófona!

O Oitavo WikiConcurso foi um concurso organizado pelos Wikipedistas para promover a qualidade dos artigos considerados essenciais na Wikipédia e, pela primeira vez, serão atribuídos prémios reais, palpáveis, pela Wikimedia Portugal e pelo grupo Wikimedia Brasil. A data do Concurso foi alinhada para coincidir também com o décimo aniversário da Wikipédia Portuguesa, tendo sido por isso decidido pela Wikimedia Portugal oferecer aos concorrentes prémios de participação (T-shirts, pins e autocolantes que faziam parte do kit oferecido pela WMF para a comemoração do 10º aniversário da Wikipédia) e 3 flash drives com o software WikiTwooGO para os primeiro classificados.

O objectivo do concurso foi, nesta edição do WikiConcurso, melhorar a qualidade dos artigos considerados essenciais para qualquer enciclopédia, e que são usados como comparação entre as Wikipédias de várias línguas e entre a Wikipédia e várias enciclopédias tradicionais. Além disso, pretendeu ser uma forma de mostrar apreço pelas contribuições dos voluntários promovendo uma competição amigável entre os editores mais produtivos da Wikipédia, festejando os 10 anos da Wikipédia com melhorias ao próprio conteúdo da enciclopédia.

Em termos de iniciativa por parte da Wikimedia Portugal, a iniciativa encontra-se descrita na página de projecto respectiva, e decorreu sobre a orientação do colega Gonçalo Themudo, a quem deixo os parabéns pelo resultado.

AddThis Social Bookmark Button

Wiki Loves Monuments… e há imensos!

May 2nd, 2011 ntavares Posted in pt_PT, web, wikipedia No Comments »

Ouvir com webReader

352px-lusitana_wlm_2011_dsvg
Em 2011 a edição do Wiki Loves Monuments (WLM) sai da esfera Neerlandesa (ou Holandesa, como diria a maior parte das pessoas). O ano passado, praticamente metade dos monumentos dos Países Baixos tiveram fotografias, e este ano as câmeras estão focadas nos monumentos de grande parte da Europa. O WLM já tem logótipo estabelecido — foi concebido por uma portuguesa (parabéns Lusitana!) — e a organização já decorre há algum tempo. Em Portugal, está a ser organizado pela Wikimedia Portugal (WMP), como é óbvio.

Setembro é o mês em que estará tudo a postos; podem ver o planeamento no Commons. Claro que podem já a começar a tirar fotos mas, para essas fotografias poderem concorrer, só poderão ser carregadas no Commons em Setembro. Se nunca utilizou o Commons, agora é uma boa altura para aprender. Se tem fotografias que nunca carregou para lado nenhum, Setembro será uma boa altura para submetê-las…. no Commons :-) Para esse efeito, será disponibilizado um formulário simplificado, para que seja ainda mais simples carregar múltiplas fotografias.

Os monumentos a fotografar não estarão apenas em países com Capítulos (associações equivalentes à WMP de outros países); por exemplo, se viajar para a Bélgica, que também participa, porque não levar uma câmera, e concorrer para os dois países. Para Portugal, a lista já está disponível e a ser compilada com toda a informação disponibilizada pelo IGESPAR e SIPA/IHRU.

Em Portugal, espera-se uma cerimónia de entrega de prémios, e uma nova oportunidade de conhecer e reencontrar Wikipedistas lusos.

Aqui fica um vídeo de apresentação para esta iniciativa:

AddThis Social Bookmark Button

10º Aniversário Wikipédia

January 11th, 2011 ntavares Posted in lazer, pt_PT, wikipedia No Comments »

Ouvir com webReader

Caros, mais do que explicar-vos do que se trata, vejam o outdoor que fizémos! Aproveito para deixar o link para o site do evento. Participem e ajudem a divulgar! Basta clicar na imagem, imprimir e afixar algures! :-)

cartaz-escuro150dpi500x.

Parabéns Wikipédia!

AddThis Social Bookmark Button

Berlin Wikimedia Chapters Meeting 2010 a.k.a. [well actually...] VulcanoCon and Porto Wikipedia Academy 2010

August 14th, 2010 ntavares Posted in en_US, wikipedia No Comments »

Ouvir com webReader

Berlin, Germany - Wikimedia Chapters Meeting 2010

These have been busy days! At the same time the first Portuguese Wikipedia Academy was running I was supposed to be in Berlin to the 2010 Wikimedia Chapters Meeting. I actually got there, indeed, but we were in the air when the massive ash cloud from the Eyjafjallajökull glacier/vulcano spread above Central Europe, and we got stuck as soon as we landed in Frankfurt. But I won’t regret catching a 10h train to Berlin, arriving in the morning, except for missing the whole morning at the Meeting. The fellow mates around the world are just awesome people, and doing a great job, and they have just shown how excellent fellows they are to work with.

Here is the wrapup photo we took in the end (after 20min trying to position ourselfs according to the Mapa Mundi and.. well.. having given up :)):

29421_400584147744_150775207744_4074764_4005963_n

Picking a train to Portugal was very risky as the French saw an excellent opportunity to put up a strike (I was told some frieds took 3 days from Netherlands to Portugal, so I’m glad we considered the odds)! While stranded, along with a lot of (mainly) intercontinental fellows, we spent the days getting to know Berlin and the famous Bratwurst. I won’t definitelly forget the trio I had near Charlottenburg, yummm.. :P

Wikimedia Deutchland has proven to be an excellent hoster for such an event. Everything we handled smoothly, Don and Anjia were also great facilitators, being careful enough to document in detail each session.

A special remark to the strange title of this post, I think no one will forget the good laughs we gave around some expressions… like VulcanoCon… hrm hrm :)

Hugs to everyone I met, I hope you arrived safely (AFAIK, you *did* arrived…). Hope to see you all next year, or maybe at Wikimania.

Porto, Portugal - Wikipedia Academy

As we already confirmed in person in the last WMP General Assembly (GA), the First Wikipedia Academy was definitely a success. The media push was spectacular and, of course, it had to give some results. We got an increase of associates right there on the GA, with more people willing to help on the tasks. I thank all the participants all the input, it was really great, and I would also like to thank the opportunity of exposing everything we learned at the Chapters Conferece (above). We also discussed the plan for the upcoming year, now, more than ever, targetting specific goals from the list of ideas we have been summing up - I’ll be participating in a specific GLAM project (more on this later), I’ll be the IT lead, I’ll try to help Gil on a joint Communication project targetting Transportation companies, and I’ll be trying to push forward a possible UMIC partnership (more on this later).

AddThis Social Bookmark Button

Academia Wikipédia: está quase!

April 10th, 2010 ntavares Posted in dri, pt_PT, wikipedia No Comments »

Ouvir com webReader

O evento resulta de uma parceria entre a Faculdade de Engenharia da Universidade do Porto e a Associação Wikimédia Portugal, contando com o apoio da EXPONOR e da DRI.

O objectivo é sensibilizar e promover o uso da Wikipédia. O seminário decorrerá, entre as 9h30 e as 18 horas do dia 16 de Abril, na QUALIFICA e terá ligação por videoconferência à 2010 Wikimedia Conference, que decorrerá em Berlim, e onde estarei com a Susana a contribuir com a experiência portuguesa e, simultaneamente, a fazer as entrevistas.

Para além da palestra de Kul Takanao Wadhwa, Head of Business Development da Wikimedia Foundation, haverá espaço para o debate de temas como a qualidade e a fiabilidade da Wikipédia, o uso da Wikipédia nas aulas, a Wikipédia como instrumento de protecção e promoção de línguas minoritárias, a Wikipédia na investigação e ainda informação detalhada sobre edição de conteúdos, licenciamento e ligações a projectos. A sessão está aberta ao público em geral, desde estudantes, professores, investigadores e outros especialistas do meio académico.

A participação na Academia Wikipédia é gratuita, mas com inscrição obrigatória. Poderá fazer a sua inscrição online aqui:
http://academia-wikipedia.org/inscricao.php.


Se és dos que vão à Wikipédia antes de fazer um trabalho, ou enquanto pesquisas profissionalmente, então este evento tem entrada livre, realiza-se a 16 de Abril, na Exponor, e parece ideal para ti!

AddThis Social Bookmark Button

Academia Wikipédia: Call for Papers

February 25th, 2010 ntavares Posted in pt_PT, wikipedia No Comments »

Ouvir com webReader

Está aberta a Chamada a Oradores para o primeiro evento organizado pela Associação Wikimedia Portugal (WMP)!

A Wikimedia Portugal, em conjunto com a Faculdade de Engenharia da Universidade do Porto (FEUP), está a organizar o primeiro Workshop em Portugal intitulado “Academia Wikipédia” no Porto/Exponor, a realizar em simultâneo com a “Qualifica”- Feira de educação, formação, juventude e emprego, no dia 16 de Abril.

Aqui está um pequeno descritivo da Academia:
Academia Wikipédia

As apresentações deverão ser em português, sempre que possível, e devem demorar entre 20min a 30min, com alguns minutos para perguntas e respostas. Se houver necessidade de estender este tempo penso que não será impossível.

Sou eu que estou a organizar o programa, e estou a criar uma maquete aqui: Programa da Academia Wikipédia. Enviem temas que gostavam de ver abordados, se os apresentados (a título de exemplo) não vos puxa para falar. Entrem em contacto comigo, ou usem a página de contactos da WMP.

AddThis Social Bookmark Button

Início das actividades da Wikimedia Portugal

January 25th, 2010 ntavares Posted in pt_PT, wikipedia No Comments »

Ouvir com webReader

Este post já deveria ter chegado há muito mais tempo. Mas o tempo não o permitiu…

Não deve ser novidade que a Wikimedia Portugal (WMP) já arrancou o Plano de Actividades para 2010-11. A primeira actividade oficial foi uma apresentação num seminário no Instituto Superior Técnico promovido pela Presidência do Departamento de Engenharia Informática, a convite do prof. José Borbinha, que gostámos muito de conhecer e a quem agradecemos o apoio e disponibilidade que demonstrou para connosco.

A Susana fez uma exposição da Wikimedia Foundation, do nosso contexto WMP, do processo editorial, da estrutura interna dos projectos (utilizadores, categorias, etc), da manutenção, licenciamento, etc.

A apresentação está aqui:
http://wikimedia.pt/download/Wikimedia_Slideshow.pps

Eu juntei-me à festa, atendendo a um público de informática, e apresentei brevemente a plataforma da WMF (servidores, software, arquitectura) mas o grosso da minha mini-apresentação foi para falar de predefinições, dados estruturados e seus benefícios na Wikipédia e, por fim, divaguei um bocadinho até à Web Semântica, conceito para o qual a Wikipédia está a ser bastante utilizada (os tópicos estão resumidos em 2 posts que já tinha feito no blog [1][2]).

A apresentação está aqui:
http://wikimedia.pt/download/Wikimedia_Web_Semantica.pps

AddThis Social Bookmark Button

Actualização das páginas órfãs

October 18th, 2009 ntavares Posted in pt_PT, wikipedia No Comments »

Ouvir com webReader

A pedido do Lijealso, aqui vai uma actualização das estatísticas incompletas da Wikipédia lusófona para o caso das páginas órfãs.

Constatou-se que o dump utilizado anteriormente era insuficiente, pelo que se descarregou a tabela pagelinks, desta vez do dump de 20091015. Para se excluir os redireccionamentos, importou-se também a tabela redirect.

Fartei-me entretanto de alternar entre o que estava a fazer e a lista de códigos de domínios, pelo que criei uma pequena tabela auxiliar:

MySQL:
  1. mysql> CREATE TABLE _namespaces ( id TINYINT NOT NULL, namespace VARCHAR(50), PRIMARY KEY (id) );
  2. Query OK, 0 rows affected (0.01 sec)
  3.  
  4. mysql> INSERT INTO _namespaces VALUES (-2,'Media'),(-1,'Especial'),(0,''),(1,'Discussão'),(2,'Usuário'),(3,'Usuário Discussão'),(4,'Wikipedia'),(5,'Wikipedia Discussão'),(6,'Ficheiro'),(7,'Ficheiro Discussão'),(8,'MediaWiki'),(9,'MediaWiki Discussão'),(10,'Predefinição'),(11,'Predefinição Discussão'),(12,'Ajuda'),(13,'Ajuda Discussão'),(14,'Categoria'),(15,'Categoria Discussão'),(100,'Portal'),(101,'Portal Discussão'),(102,'Anexo'),(103,'Anexo Discussão');
  5. Query OK, 22 rows affected (0.00 sec)
  6. Records: 22  Duplicates: 0  WARNINGS: 0

O resultado deu-me um incrível total de 769854 páginas órfãs, pelo que decidi separá-las por namespace para permitir prioritizar a análise:

MySQL:
  1. mysql> SELECT p.page_namespace,count(1) FROM page p
  2.     -> LEFT JOIN redirect  r
  3.     -> ON p.page_id = r.rd_from
  4.     ->
  5.     -> LEFT JOIN pagelinks pl
  6.     -> on pl.pl_namespace = p.page_namespace
  7.     -> and pl.pl_title = p.page_title
  8.     ->
  9.     -> WHERE r.rd_from IS NULL
  10.     -> AND pl.pl_from IS NULL
  11.     ->
  12.     -> GROUP BY p.page_namespace;
  13. +----------------+----------+
  14. | page_namespace | count(1) |
  15. +----------------+----------+
  16. |              0 |    12958 |
  17. |              1 |   103645 |
  18. |              2 |    16592 |
  19. |              3 |   568675 |
  20. |              4 |     1954 |
  21. |              5 |      856 |
  22. |              8 |      773 |
  23. |              9 |       17 |
  24. |             10 |     7522 |
  25. |             11 |     1014 |
  26. |             12 |        3 |
  27. |             13 |       27 |
  28. |             14 |    51735 |
  29. |             15 |     1315 |
  30. |            100 |     1190 |
  31. |            101 |      117 |
  32. |            102 |      173 |
  33. |            103 |     1288 |
  34. +----------------+----------+
  35. 18 rows in SET (20.90 sec)

O resultado do cruzamento das duas tabelas foi afixado aqui, com uma listagem de 15M para os 12958 artigos no domínio principal. Na verdade, esta listagem foi feita para colar numa página wiki, no entanto tenham em atenção que são 15M, pelo que não recomendo fazê-lo. Têm outras listas (como a mais simples, em formato pageid,namespace,title) nessa directoria.

AddThis Social Bookmark Button

Revisita aos dumps da Wikipédia

October 6th, 2009 ntavares Posted in pt_PT, wikipedia 1 Comment »

Ouvir com webReader

Desta vez em português, decidi dar [alguma] continuidade ao que comecei há uns dias com a importação dos dumps da Wikipédia. Graças à dica do Rei-artur foi fácil extrair a lista de robôs, para excluir das estatísticas.

CODE:
  1. [myself@speedy ~]# wget 'http://pt.wikipedia.org/w/api.php?action=query&list=allusers&aufrom=A&augroup=bot&aulimit=500&format=txt' -q -O - > bots.tmp
  2.  
  3. [myself@speedy ~]# cat bots.tmp | grep '\[name\]' | sed 's,^.*\[name\] => ,,' > /tmp/bots.txt

Aproveitei e repesquei os user_id para simplificar as pesquisas sem fazer alterações na tabela user.

MySQL:
  1. mysql> CREATE TABLE user_bots ( bot_name VARCHAR(25) );
  2. Query OK, 0 rows affected (0.01 sec)
  3.  
  4. mysql> LOAD DATA INFILE '/tmp/bots.txt' INTO table user_bots;
  5. Query OK, 136 rows affected (0.00 sec)
  6. Records: 136  Deleted: 0  Skipped: 0  WARNINGS: 0
  7.  
  8.  
  9. mysql> ALTER TABLE user_bots add COLUMN bot_user_id INT;
  10. Query OK, 136 rows affected (0.01 sec)
  11. Records: 136  Duplicates: 0  WARNINGS: 0
  12.  
  13. mysql> ALTER TABLE user add index idx_t ( user_name );
  14. Query OK, 119134 rows affected (2.63 sec)
  15. Records: 119134  Duplicates: 0  WARNINGS: 0
  16.  
  17. mysql> UPDATE user_bots ub JOIN user u on user_name = bot_name SET ub.bot_user_id = u.user_id;
  18. Query OK, 134 rows affected (0.00 sec)
  19. Rows matched: 134  Changed: 134  WARNINGS: 0
  20.  
  21. mysql> ALTER TABLE user_bots add PRIMARY KEY (bot_user_id);
  22. Query OK, 136 rows affected, 1 warning (0.00 sec)
  23. Records: 136  Duplicates: 0  WARNINGS: 1
  24.  
  25. mysql> SHOW WARNINGS;
  26. +---------+------+---------------------------------------------------+
  27. | Level   | Code | Message                                           |
  28. +---------+------+---------------------------------------------------+
  29. | Warning | 1265 | Data truncated for COLUMN 'bot_user_id' at row 71 |
  30. +---------+------+---------------------------------------------------+
  31. 1 row in SET (0.00 sec)
  32.  
  33. mysql> UPDATE user_bots SET bot_user_id = -1 WHERE bot_user_id = 0;
  34. Query OK, 1 row affected (0.00 sec)
  35. Rows matched: 1  Changed: 1  WARNINGS: 0

Não tinha reparado que havia um utilizador/robô com o nome "MediaWiki default" mas, bem, depois de criar a Primary Key ficou com o bot_user_id=0 e, para evitar que coincidisse com o agregado para anonymous, dei-lhe o bot_user_id=-1.

Então agora já estamos prontos a completar a query onde ficámos no último dia (número de edições em artigos distintos em cada namespace por utilizador):

MySQL:
  1. mysql> EXPLAIN SELECT epn.user_name,epn.page_namespace,epn.edits
  2.     -> FROM edits_per_namespace epn
  3.     -> LEFT JOIN user_bots ub ON epn.user_id = ub.bot_user_id
  4.     -> WHERE ub.bot_user_id IS NULL
  5.     -> AND epn.user_id <> 0
  6.     -> ORDER BY edits desc limit 20;
  7. +----+-------------+-------+--------+---------------+---------+---------+----------------------+--------+--------------------------------------+
  8. | id | select_type | table | type   | possible_keys | key     | key_len | ref                  | rows   | Extra                                |
  9. +----+-------------+-------+--------+---------------+---------+---------+----------------------+--------+--------------------------------------+
  10. 1 | SIMPLE      | epn   | ALL    | NULL          | NULL    | NULL    | NULL                 | 187624 | USING WHERE; USING filesort          |
  11. 1 | SIMPLE      | ub    | eq_ref | PRIMARY       | PRIMARY | 4       | ntavares.epn.user_id |      1 | USING WHERE; USING index; NOT EXISTS |
  12. +----+-------------+-------+--------+---------------+---------+---------+----------------------+--------+--------------------------------------+
  13. 2 rows in SET (0.00 sec)
  14.  
  15. mysql> SELECT epn.user_name,epn.page_namespace,epn.edits
  16.     -> FROM edits_per_namespace epn
  17.     -> LEFT JOIN user_bots ub ON epn.user_id = ub.bot_user_id
  18.     -> WHERE ub.bot_user_id IS NULL
  19.     -> AND epn.user_id <> 0
  20.     -> ORDER BY edits desc limit 10;
  21. +----------------+----------------+-------+
  22. | user_name      | page_namespace | edits |
  23. +----------------+----------------+-------+
  24. | EMP,Nice poa   |              0 | 58138 |
  25. | Dantadd        |              0 | 44767 |
  26. | João Carvalho  |              3 | 44533 |
  27. | OS2Warp        |              0 | 43396 |
  28. | Yanguas,Sonlui |              0 | 37020 |
  29. | Lijealso       |              0 | 34157 |
  30. | Rei-artur      |              0 | 33863 |
  31. | Tumnus         |              3 | 33213 |
  32. | Nuno Tavares   |              0 | 31910 |
  33. | Bisbis         |              0 | 29886 |
  34. +----------------+----------------+-------+
  35. 10 rows in SET (0.76 sec)

Os resultados completos estão aqui.

Já agora, para finalizar, a tão afamada lista de wikipedistas por número de edições:

MySQL:
  1. mysql> CREATE TABLE edits_per_user SELECT rev_user,count(1) as counter FROM revision GROUP BY rev_user;
  2. Query OK, 119134 rows affected (12.61 sec)
  3. Records: 119134  Duplicates: 0  WARNINGS: 0
  4.  
  5. mysql> SELECT u.user_name,epu.counter
  6.     -> FROM edits_per_user epu
  7.     -> LEFT JOIN user_bots ub on ub.bot_user_id = epu.rev_user
  8.     -> JOIN user u on epu.rev_user = u.user_id
  9.     -> WHERE ub.bot_user_id IS NULL ORDER BY counter desc limit 10;
  10. +----------------+---------+
  11. | user_name      | counter |
  12. +----------------+---------+
  13. | anonymous      | 3119758 |
  14. | EMP,Nice poa   |  176338 |
  15. | OS2Warp        |  163751 |
  16. | Dantadd        |  105657 |
  17. | Lijealso       |   90025 |
  18. | Yanguas,Sonlui |   89152 |
  19. | Rei-artur      |   83662 |
  20. | Mschlindwein   |   75680 |
  21. | Bisbis         |   75361 |
  22. | Nuno Tavares   |   73141 |
  23. +----------------+---------+
  24. 10 rows in SET (0.05 sec)

Os resultados completos estão aqui.

AddThis Social Bookmark Button

Revisita aos dados estruturados

October 3rd, 2009 ntavares Posted in pt_PT, wikipedia No Comments »

Ouvir com webReader

Há alguns dias num mergulho profundo sobre a utilização de wikis em campos específicos deparei-me com uma "foto" da Wikipédia muito interessante, aqui, que ilustra, entre outras coisas, a actividade na Wikipédia, a vários níveis: Visualizing Science & Tech Activity in Wikipedia:


Fonte: A Beatiful WWW

O website, A Beatiful WWW, dedica-se à extracção e representação dos volumes de informação distintos que conhecemos hoje. Eu já tinha falado nisto e descobri, entretanto, que o Google disponibiliza uma API de representação de dados estruturados.

Consigo pensar numa série de brincadeiras para isto :) Imaginem, por exemplo, juntar isto tudo, logo agora que a Wikimedia vai estar empenhada em manter os conteúdos disponíveis no Amazon Public Data Sets!..

Olhem aqui um exemplo do que pode ser feito, desta vez com Hadoop e Hive: Hot Wikipedia Topics, Served Fresh Daily.

AddThis Social Bookmark Button