gnusiervos: febrero 2009

Script SCAN+OCR para test (TESSERACT-OCRAD-GOCR)

OCR personalizado en Debian

Objetivo: Escanear y reconocer 500 paginas de texto impresas

Un amigo necesita pasar su libro escrito parte en maquina de escribir y parte impreso en PC (sin acceso a los archivos digitales)
Me propuse hacerlo en debian de la manera mas simple posible. Mi tarea es definir como seria el proceso y derivar el trabajo a un usuario no muy capacitado.

Tengo una multifuncion HP PSC 1510 conctada por USB. La impresora no me habia dado problemas pero nunca habia usado el escanner en debian lnny.
Luego de verficar con "lsusb" (desde la consola entrega una lista de dispositivos USB conectados) que estuviera detectado. Me di cuenta de que al abrir los programas de escaneo como usuario no tenia acceso al escaner. Luego de buscar en internet me di cuenta de que lo predeterminado es que los usuarios no-root no pertenecen al grupo "escanner" asi que es necesario configurar en "usuarios y grupos" el acceso de los usuarios que vayan a usar el escanner.

Con el scanner fucionando busque programas para escanear (se consiguen muy facil por synaptic o desde la consola con apt):
.- xsane 0.996 .- Completo y concreto a lo que se necesita para escanear. Para reconocer caracteres usa GOCR, pemite usar otros pero esta mas preparado para GOCR.
.- kooka0.44 .- Interesante, util como xsane. Para reconocer caracteres usa GOCR u OCRAD.
.- gscantopdf 0.9.25 .- Esta hecho para automatizar la creacion de PDF con imagenes de escaneos (imagino que para revistas es muy practico). Incluye OCR, a diferencia de los dos anteriores pemite "tesseract" como motor de OCR y detecta para este ultimo los idiomas instalados. Como contra no tiene la posibilidad de grabar a texto lo que se reconoce (solo copiar y pegar).

En resume me gusto mas xsane por la simplicidad y cantidad de opciones pero el reconocimiento de texto era mejor gscantopdf al tener tesseract
Hay comparativas en internet, en todas tesseract es mas efectivo.
La contra de tesseract es que solo trabaja con formato TIFF y solo cuando el archivo tiene la extencion TIF (!?).

Si bien claramente el proceso de escaneo y de reconocimiento de texto deben optimizarse y manejarse por separado mi intencion no era complicar demasiado a la persona que haria el trabajo finalmente por lo que me propuse hacer un script que:

1- Escaneara la imagen con la calidad y parametros necesarios
2- Corregir la imagen (por formato necesario y si fuera posible optimizarla para OCR).
3- Realizar el reconocimiento de texto

La correcion de la imagen surge luego de descubrir "imagemagick" que nos da el comando "convert" que permite aplicar cambios de formato, de cantidad de colores e innumerables filtros graficos desde la linea de comandos. Ideal para mi script

Queria que todo sea muy simple de modo que el usuario pusiera cada hoja y al cabo de unos segundos tuviera en pantalla un editor de textos para revisar la hoja.
Despues de hacer muchas pruebas. Variar dpi del escaneo, usar 1 bit de colores, escala de grises, cambiar contraste, probar diferentes motores de OCR, etc, etc, me di cuenta que era necesario tomar una hoja base (una que sea representativa de lo que vamos a escanear) y ver que combinacion era la mejor.

Como dento de las 500 hojas elegidas no habia una sola representativa (habia por lo menos 3 grupos de entre 100 y 200 paginas con blancos de fondo diferente y fuentes diferentes) iba a necesitar optimizar cada grupo.
Es por esto que el primer script escanearia una hoja de diferentes formas, con diferentes filtros graficos y diferentes motores de ocr. A cada resultado lo grabaria e un archivo de texto de la forma

GOCR-300dpi-blancoynegro.txt
GOCR-450dpi-blancoynegro.txt
OCRAD-300dpi-blancoynegro.txt
...
TESSERACT-600dpi-grises.txt
etc, etc

Puede haber mas combinaciones a gusto. La idea es tener 12 o 15 archivos de texto sacados de la primera muestra representativa y elegir el mejor.

Hacer este script no fue simple ya que nunca habia hecho uno con mas de 5 lineas de texto. De todas formas bash no es muy complicado y ademas es muy potente.

El script final para probar los escaneos es:

*********************************************
*********************************************
*********************************************

#!/bin/bash
#MODULO PARA PROBAR QUE ES MEJOR PARA TU DOCUEMNTO
#usa tesseract - gocr - ocrad

#elegir el escaner, el comando scanimage trae una lista con el parametro -L
#leer los disponibles y ofrecer al usuario que elija (si hay solo uno no preguntar)
#scanimage debe esta en el path

clear
echo
echo "Script desarrollado por gnusiervos / http://gnusiervos.blogspot.com"
echo
echo "Buscando dispositivos de entradas de imagen"

#me interesan ahora estos dos parametros para scanimage
#-L, --list-devices show available scanner devices
#-f, --formatted-device-list=FORMAT similar to -L, but the FORMAT of the output
# can be specified: %d (device name), %v (vendor),
# %m (model), %t (type), and %i (index number)

listaScanners=$(scanimage -f "%d ")

#esto imprime un rnglon por cada dispositivo de entrada de imagenes (si hay camaras web o entradas de video estaran tambien)
#en mi caso:
#device `v4l:/dev/video0' is a Noname LifeView FlyTV Platinum FM / Go virtual device
#device `hpaio:/usb/PSC_1500_series?serial=BR6442N04D0498' is a Hewlett-Packard PSC_1500_series all-in-one

#o sea= "device 'id dispositivo' datos extras"
#debo identificar el dispostivo a usar para usar luego en el comando scanimage. Para eso busco las cadenas entre las comilla simples luego de device e cada renglon

#preservar el separador oficial IFS
exIFS=$IFS
export IFS=$" "

#la linea que sigue tomara a $listaScanners como un array separado por IFS. Tomara un valor por vez y lo asiganar a EsacanerElegido
select EscanerElegido in $listaScanners
do
if [ $EscanerElegido ];
then
echo
echo " Escaner elegido: $EscanerElegido"
break
else
echo " Opcion no valida. Saliendo del sistema"
exit 0
fi
done

#definir las combinaciones posibles
declare -a listaResoluciones=300 450
declare -a modesScanner=Lineart gray
declare -a formatScan=pnm tiff

for scanFormats in $formatScan
do
for res in $listaResoluciones
do

for modS in $modesScanner
do
echo " ---- scan $scanFormats + res $res + mode $modS"
scanimage -d $EscanerElegido --progress -v -y 279.4 -x 215.9 --format=$scanFormats --mode $modS --resolution $res > scan-$scanFormats-$modS-$res.$scanFormats

echo " ImaeClick - adaptando ..."
#necesito varios tipos de imagenes para los distintos motores (tif pnm y pgm)
# me aseguro que esten todos
if [ "$scanFormats" = "pnm" ];
then
convert scan-$scanFormats-$modS-$res.$scanFormats -monitor scan-$scanFormats-$modS-$res.tif # para tess
else
convert scan-$scanFormats-$modS-$res.$scanFormats -monitor scan-$scanFormats-$modS-$res.pnm # multiple formato pbm y pgm
fi

convert scan-$scanFormats-$modS-$res.$scanFormats -monitor scan-$scanFormats-$modS-$res.pgm #escala de grises
convert scan-$scanFormats-$modS-$res.$scanFormats -monitor scan-$scanFormats-$modS-$res.pbm #1 bit

#convert de imageclick tiene decenas de filtros graficos. Seguramente habra algunos que mejoraran la imagen para escaneo
#seria bueno poner algunos aqui

#---------TESSERACT----------------------------------------------------
#pasarle todos los motores ocr encontrados
echo " OCR 1 = TESSERACT"
tesseract scan-$scanFormats-$modS-$res.tif scan-$scanFormats-$modS-$res-OCR-TESS.tif -l spa

#---------OCRAD--------------------------------------------------------

#segun el escaneo necesitaremos cosas diferentes
if [ "$modS" = "Lineart" ];
then
#uso los archivos pbm que son byn de 1 bit
echo " OCR 2 = OCRAD iso-8859-9"
ocrad scan-$scanFormats-$modS-$res.pbm -c iso-8859-9 -f -v -o scan-$scanFormats-$modS-$res-OCR-OCRAD-iso88599.txt

echo " OCR 2 = OCRAD - ascii"
ocrad scan-$scanFormats-$modS-$res.pbm -c ascii -f -v -o scan-$scanFormats-$modS-$res-OCR-OCRAD-ascii.txt

echo " OCR 3 = GOCR - ascii"
gocr -f ASCII scan-$scanFormats-$modS-$res.pbm > scan-$scanFormats-$modS-$res-OCR-GOCR-ascii.txt

echo " OCR 3 = GOCR - ISO8859_1"
gocr -f ISO8859_1 scan-$scanFormats-$modS-$res.pbm > scan-$scanFormats-$modS-$res-OCR-GOCR-ISO8859_1.txt

echo " OCR 3 = GOCR - UTF8"
gocr -f UTF8 scan-$scanFormats-$modS-$res.pbm > scan-$scanFormats-$modS-$res-OCR-GOCR-UTF8.txt

else
#uso los de escala de rises pgn

echo " OCR 2 = OCRAD - iso-8859-9"
ocrad scan-$modS-$res.pgm -c iso-8859-9 -f -v -o scan-$modS-$res-OCR-OCRAD-iso88599.txt

echo " OCR 2 = OCRAD - ascii"
ocrad scan-$modS-$res.pgm -c ascii -f -v -o scan-$modS-$res-OCR-OCRAD-ascii.txt

echo " OCR 3 = GOCR"
gocr scan-$modS-$res.pbm > scan-$modS-$res-OCR-GOCR.txt

echo " OCR 3 = GOCR - ascii"
gocr -f ASCII scan-$modS-$res.pgm > scan-$modS-$res-OCR-GOCR-ascii.txt

echo " OCR 3 = GOCR - ISO8859_1"
gocr -f ISO8859_1 scan-$modS-$res.pgm > scan-$modS-$res-OCR-GOCR-ISO8859_1.txt

echo " OCR 3 = GOCR - UTF8"
gocr -f UTF8 scan-$modS-$res.pgm > scan-$modS-$res-OCR-GOCR-UTF8.txt

fi
done
echo "FIN MODES"
done
echo "FIN RESOLUTIONS"
done
echo "FIN FORMATS"

#devolver el separador oficial IFS
export IFS=exIFS

echo "################ FIN ################"
exit 0

*********************************************
*********************************************
*********************************************

Luego de ejecutarlo esaran los archivos de texto disponible para elegir la mejor opcion

Mi resumen (probando textos sin imagenes a 1 sola columna) es:

Mejor OCR:
1º Tesseract
2º OCRAD
3º GOCR

Velocidad
1º OCRAD
2º Tesseract
3º GOCR

No asustarse por algunos resultados. GOCR puede entregar verdaderos geroglificos.
Siempre se puede configurar mejor y encontrar soluciones.

rr

Algunas referencias usadas
*********************************************
comparativa muy ineteresante
http://www.mscs.dal.ca/~selinger/ocr-test/

ejemplo de script
http://jduck.net/2008/01/05/ocr-scanning/

muy buena descripcion de convert
http://www.imagemagick.org/www/command-line-options.html

refresque mi pobre conocimiento de bash en:
parte I http://www.linux-es.org/node/70
parte II http://www.linux-es.org/node/107
parte III http://www.linux-es.org/node/147
parte IV http://www.linux-es.org/node/238

OCRAD en español
http://www.gnu.org/software/ocrad/ocrad_es.html

linux para mujeres o pequeñas opiniones inesperadas

No es comun escuchar a mi esposa hablar de linux. Mucho menos cosas buenas

En general cambio mi instalación de linux cada 1 o 2 meses solo por cuestiones de curiosidad.

Esta ultima vez (pase de kubuntu (para conocer KDE 4.2) a lenny) recibi quejas satisfactorias. La conversación ya fue mas o menos asi.

- Me pusiste los juegos en el linux esta vez?- Dijo mi esposa

- Desde cuando te interesa linux ?

- A veces me gusta jugar al solitario

- Pero Windows tiene el solitario tambien

- El de linux es mas "inteligente"

- Como ?

- Si las jugadas que son mas simples en linux el juego las hace solas y m ahoran tiempo

- Bueno, me voy a fijar y te las voy a instalar

- Ademas tiene el juego de las pelotitas de colores (refiriendose al same gnome o jugo de iguales o tantos otos nombres) que me gusta y en windos no esta

......................................

Ya tienen un argumento para que sus esposas usen linux !

Midiendo calidad de software

"La unica manera de medir la calidad del software: WTF/minuto"

Sacado de aqui

Another Binary Joke

El 100 % de la gente entiende el sistema binario, el 1100000 % lo desconoce.

Nota, es posible que e este contecxto el signo % no corresponda

Ecosistema GNU/Linux: Gnome

"GNU Network Object Model Environment" más conocido como GNOME fue comenzado en 1997 por Miguel de Icaza y Federico Mena (ambos Mexicanos)

Al igual que muchos proyectos de software libre se ha creado una fundación encarada de promover y conservar el proyecto.

La Fundación GNOME esta manejada por un consejo directivo y secundada por un consejo consultor

El consejo directivo está integrado a lo sumo por catorce miembros elegidos democráticamente por los miembros de la Fundación GNOME. La membresía sigue un modelo meritocrático, lo que viene a decir que para ser miembro de la Fundación GNOME se debe de haber colaborado de alguna u otra manera con el proyecto GNOME. La aportación no tiene por qué ser código, también existen tareas de traducción, organización, difusión, etc. por las que uno puede pedir ser miembro de la Fundación GNOME y tener derecho a voto. Por tanto, son los miembros de la Fundación los que se pueden presentar al consejo directivo y los que, democráticamente, eligen a sus representantes en el mismo de entre los que se hayan presentado. En la actualidad, la votación se lleva a cabo por correo electrónico.

Existen una normas básicas para garantizar la transparencia del consejo directivo. La más llamativa es la limitación de miembros afiliados a una misma empresa, la cual no puede exceder de cuatro empleados. Es importante hacer hincapié en que los miembros del consejo directivo lo hacen siempre a nivel personal y nunca en representación de una compañía (lo que yo llamaría el sistema de "hats" de Apache).

El consejo consultor es un órgano sin capacidad de decisión que sirve como vehículo de comunicación con el consejo directivo. Está compuesto por compañías comerciales de la industria del software como Red Hat™, Ximian™, HP™, etc. así como por organizaciones no comerciales como la Fundación del Software Libre o el proyecto Debian. Para formar parte del consejo de consultores se exige una cuota a todas las empresas con más de 10 empleados.

El total de integrantes son varios cientos segun gnome.org.

El proyecto es muy grande e incluye muy variados proyectos
Llendo al código según ohloh el 44% esta escrito en C y el mayor contribuyente alk código es "Kjartan Maraas"
Dento de todos los equipos internos que trabajan (Accesibilidad, testing, administracion, traduccion, usabilidad, etc) los desarolladores estan agrupados en Gnome Love

En otro sitio (abril 2008) el detalle mas completo indica que son 10.000.000 de lineas de codigo y el 76% esta en C

La verdad es que hay poca informacion, asi que entre a flossmetrics y baje un archivo sql con mas datos. Como habia uno para cada subproyecto (y son muuuuchos) elegi gnome-desktop
Tome una tabla que tenia un log de los commits (4284 (solo 1981 con email)) desde el 24/11/1997 hasta el 5/9/2008 y tomando lo que estaba detras del @ del que enviaba genere las siguientes estadisticas.

No es para tomar muy en serio pero los datos tiene cierta validez. Recuerden que es solo sobre gnome-desktop. Además cada cambio al sistema puede ser simple o muy valioso. Aqui todos valen uno.

Proyecto + commits + % del total

1º Voluntarios gnome de diferentes paises
485 / 24,48%
(@gnome* son varios diferentes)

2º @skynet.ie - University of Limerick Computer Society (??)
195 / 9,84%

3º 5z.com - ??
138 / 6,97%

4º NOVELL -
85 / 4,29%
(sumatoria de: @suse.de 53 + @novell.com 16 + @ximian.com 16)

5º @redhat.com
79 / 3,99%

6º @menthos.com
48 / 2,42%

7º @online.no (Algunos noruegos (??))
45 / 2,27%

8º @fib.hl.no (Mas noruegos)
43 / 2,17%

9º @sun.com - SUN
38 / 1,92%

10º @szif.hu (Algunos hungaros)
33 / 1,67%

11º @stanford.edu - Universidad de Standford
31 / 1,56%

41º @debian.org - DEBIAN
7 / 0,35%

Sobre los aportes de dinero
Tiene varios niveles

Filantropo 1200 dólares o mas
Sponsor 500 - 1200 dolares
Asociado 25-500
Adopte un hacker (ja!) 10 dolares mensuales

La lista de 2008 destaca como aportantes:

Charles French
Soren Impey
Edward Swartz
PeopleWare SL
Erik Verkuil

La lista completa esta aqui
No aparecen empresas-sponsor como vi en Apache

Conclusiones
El proyecto Gnome es en realidad un conjunto interminable de subproyectos.
A juzgar por el funcionamiento general se puede decir que funciona excelente. Por algo es el escritorio predeterminado de la mayoría de las distribuciones

rr

-----------------------
Fuentes consultadas:
http://es.wikipedia.org/wiki/GNOME
http://www.es.gnome.org
http://www.gnome.org
http://www.ohloh.net/
http://gsyc.escet.urjc.es/moodle/mod/forum/discuss.php?d=5848

--------------------
Actualización 13-03-09
También disponible Open Office

Ecosistema Linux: Apache

Bien, el proceso iniciado en un post anterior y continuado luego va tomando forma.

Voy a revisar a medida que pueda un proyecto por vez. Espero colaboración y comentarios por favor. Hay mucho material en ingles y no es simple

En resumen voy a tratar de saber de cada proyecto quien lo programa y quien lo paga.

En este caso elegí Apache, quizás uno de los mas usados (no necesariamente más conocido)

Fuentes principales:
ohloh y The Apache fundation

Desarrollo:
En los últimos 12 meses hubo 42 contribuyentes al proyecto.

El software lo aportan usuarios voluntarios. La lista de los mayores contribuyentes de código no indican pertenencia a ninguna empresa/distro (por lo menos en al fuente consultada)
El primero en la lista de desarrolladores se hace llamar "wrowe"
La info de cada contribuyente es muy limitada

La lista de los mas importantes se puede consultar aquí

Sobre las contribuciones de empresas/distros
Publican:
----------
¿Es cierto que algunas empresas son parte de Apache?
No.
La composición de la ASF se compone de individuos, no las empresas.
----------
Entienden que cada persona que esta en Apache vive del sueldo de otra empresa. Hablan mucho en la página de "hat" (sombreros) para referirse a las diferencias de intereses. Por ejemplo piden que los participantes se pongan el "sombrero" de Apache cuando están dentro y dejen los "sombreros" de sus empresas fuera.

Detalle:
Viendo la lista de contribuyentes al codigo aparece entre los primeros 100 uno con el logo de "red hat" (ja!). Puede ser por 3 motivos
1- No le quedo claro lo de los hats
2- Es un gracioso,
3- Red Hat colabora a través de el

Aportes de dinero
Los aportes de dinero se pueden hacer según escalas. La mas alta es "Sponsors de platino" (100.000 dolares al año)

Alli estan Google, Microsoft y Yahoo

"Sponsors de oro" (40.000 dolares al año)
HP

La lista completa esta aquí

Bonus y conclusiones:

Su lema es: "Meritocracy in Action" (Meritocracia en acción)

Lo de "meritocracia" suena a utopía pero parece que les funciona

-----------
Cuando el grupo consideró que la persona había "ganado" el mérito de ser parte de la comunidad de desarrollo, se concede acceso directo al repositorio de código, aumentando así el grupo y el aumento de la capacidad del grupo para desarrollar el programa, y mantener y desarrollar de manera más eficaz.

Llamamos a este principio básico "la meritocracia": literalmente, el gobierno por su mérito.
--------------------
Además los balances y mucha otra información están publicados en su sitio.
Parece un proyecto consistente y prolijo

En resumen: Aplausos para apache

rr

--------------------
Actualización 13-03-09
También disponible Open Office

Gracias Lenny !

Ya esta lista la versión 5 de Debian

http://debian.org/

En los ultimos dos meses he instalado y usado Debian, ArchLinux, Suse, Fedora, Ubuntu, XUbuntu, Kubuntu, Mandriva, etc.

Debian a mi modo de ver ha sido el más prácico, ligero y confiable.

Los links de descarga estan en
http://debian.org/CD/http-ftp/#stable

Puedes bajar la version i386-CD (si tienes una pentium II, III, Celeron, etc)
Puedes bajar la version amd64-CD (Si tienes cualquier amd mas menos nuevo)

Humor Negro III

no puedo parar ...

Humor negro II

solo para entendidos

Humor negro (doblemente)

Al decir doblemente negro quedo como un maldito racista pero es que no he podido parar de reirme desde que vi la imagen.

Libertad

GNOME 3.0

Sin anuncios oficiales ni fecha de salida ya millones de blogers hablan de gnome 3.0, incluso muestran imágenes y videos

Como veo que es gratis inventar información yo también publico imágenes de GNOME 4.7 que funcionara en windows 8

basta !

Ecosistema Linux v1.2

Bien, me he dispuesto a conseguir la lista de contribuciones por empresa/distro (para completar el post anterior) de:

GNOME
KDE
Open Office

He enviado email y me suscrito a cuanta lista existe para pedir los datos
Antes de esto trate de usar gitstat / statsvn y otras hierbas. No he conseguido demasiado.

Algunos detalles en el camino:
* KDE dispone de algunas direcciones de correo y caras visibles para contactar y gnome solo me ha derivado con su lista de correo
* El idioma predeterminado de la suscripción GnomeHISPANO es el ingles
* OpenOffice desea aclarar que el proyecto es "OpenOffice" y no "Open Office"

En la página de OpenOffice
Major Contributors
Sun Microsystems, Inc.
Novell, Inc.
Beijing Redflag CH2000
Red Hat, Inc.
IBM Corp.
Google Inc.

Sin mayores detalles

Espero más respuestas para los próximos días

--------------------
Actualización 13-03-09
Mas datos de Open Office

agonizan las compañias discograficas

Federico Heiz de via libre da un buen ejemplo sobre el NO al canon a los soportes digitales en argentina.

Se esta tramitando un proyecto para agregar al precio de los soportes digitales (pendrive, cd, dvd, mp3s, discos rigidos y todo lo que se les ocurra) solo para darselo luego a compañias discográficas, agrupaciones de autores etc. Esto es para Argentina pero ya existe en otros paises.

El ejemplo es Heinz es contundente.

No entiendo ¿por que insisten en los discos compactos?

YA NO SIRVEN

Cualquier material audiovisual puede llegar a ser digital. No se puede tapar el sol con las manos.

Si cada autor tuviera su sitio web con la venta de su música no necesitarian mas a las compañias discograficas. Ya no hace falta ayuda para distribuir.

Uno de los grandes beneficios anteriormente era la posibilidad de que tu compañia discografica pusiera tu disco en todo el pais o incluso paises vecinos.

Ahora no hace falta.

Con un programador y una cuenta de paypal los artistas pueden vender todo lo que quieran sin ayuda de nadie. 100% para ellos.

El ecosistema linux (¿quien lo hace realmente?)

En la lista correo de GRULIC recomendaron este video

Es mas que interesante y es información que no he visto disponible con anterioridad

Como el video esta en ingles tome nota de las planillas que se muestran y las muestro aquí
Por favor si alguien sabe un poco mas de ingles y puede aportar algo sera bienvenido

"Greg Kroah-Hartman Linux Plumbers Keynote"

Contribuciones de Canonical (para los desprevenidos son los que hacen Ubuntu) al kernel linux = 100 parches (0.1%)

Contribuciones por medio de distribuciones

2º Red Hat ...........11846 parches
5º Novel ...............7222
14 MontaVista ........1074
41 Debian .............288
45 Mandriva ..........237
48 Gentoo .............229
53 WindRiver .........207
56 rPath ................186
79 Canonical ..........100
(1º Amateurs (no trabajan en ninguna distro))

El ecosistema linux segun lineas de código

Kernel ................6.000.000
gcc ....................3.700.000
x.org ..................1.700.000
binutils ...............1.500.000
glibc ...................1.000.000
alsa .................... 250.000
man pages ........... 150.000

Contribuciones al kernel

1 Amateurs ...........17%
2 Red Hat .............11.9%
3 Desconocidos .......8.3%
4 IBM .....................7.8 %
5 Novell ..................7.3%
6 Intel ....................4.4%
7 Consultoras .........2.1%
8 Oracle .................1.9%
9 Linux Fundation ...1.8
10 SGI ....................1.8%

Contribuciones a GCC

1 Amateurs ................37%
2 Codesourcery ..........13%
3 Red Hat e IBM .......... 8%
5 Novell ......................7%
6 Google .....................6%
7 ST ...........................2%
8 Intel y AMD ..............2%
Canonical = 1 parche = 0.3%

Contribuciones x.org

1 red hat ................26.8%
2 Desconocidos .......18.8 %
3 Intel ....................12.7%
4 Sun .......................8.8%
5 Amateurs ...............8.3%
6 Novell ................... 8.3 %
7 Tungsten Grap. ......4.6%
8 AMD ......................3.1%
9 NSA (gob de USA) ....2.1%
10 Apple ...................1.7%
Canonical 10 parches 0.46%

Contribuciones a binutils

1 Amateurs ............40%
2 Red Hat ...............18%
3 Codesourcery .......17%
4 ibm .......................8%
5 novell ....................4%
6 goole .....................2%
7 MIPS .....................2%
8 Inode.at / HP ..........2%
9 Apple / Analog ....... 1%

Contribuciones a ALSA

1 red hat .........41.3 %
2 novell ...........39.8%
3 amateurs ......17.3%

man pages: soportadas por google y linux fundation

******************************

Actualizacion 16/2.

Continua en este post

******************************

Actualizacion 13-03-09
Tambien detalles de
Apache
Gnome
Open Office

juegos 3d en linux (es muy complicado)

Paso 1:
sudo apt-get install openarena (descarga 280 MB)

Paso 2:
openarena

listo, lo hice un kubuntu pero deberia ser igual en ubuntu o debian
Fue en la consola pero mas fácil puede ser con synaptic / adept

¿de que se quejan ...?

rr

nostalgia

de nada ...

rr

que es microsiervos ?

Es un grupo de personas que saben hablar en ingles y tomando ventaja de eso traducen blogs interesantes en otro idioma para que los tristes hispanoparlantes veamos un poco del mundo exterior.

Lo dije finalmente ...

rr

Eliminar virus en pendrive autoejecutable

Me estoy cansando de encontrarme con dispositivos usb con virus, todos iguales. Me refiero a que se convierten en auto-ejecutables (lo notarán por que aparece un archivo oculto y de sistema llamado "autorun.inf").

Si usas linux no necesitas nada de esto, solo debes preocuparte si usas alguna versión de Windows.

Lamentablemente los pendrives no traen como los diskettes un switch para usar como solo lectura.

Lo cierto es que poner tu pendrive en algunos equipos es menos seguro que tener relaciones sexuales con un vampiro que trabaja en un pabellón de infectados de HIV.

Para esto debemos en primer lugar tener en cuenta como funcionan los dispositivos externos en windows (me refiero a CDs y pendrives).
Estos opcionalmente pueden ejecutar programas al insertarse. En principio puede parecer interesante pero resulta que miles de virus han tenido la fantastica idea de replicarse por ese medio.

O sea si insertas tu pendrive en un equipo infectado tu pendrive se convertirá en ejecutable y sera medio de transporte del virus.
Debes hacer 2 cosas:

1- Asegurarte que en tu PC no se autoejecuten los pendrives (de esta forma si colocas algún pendrive extraño tu pc no se contaminara)

Pasos para deshabilitar reproducción automática de dispositivos
(gracia manu!!)

Primero hacemos clic en Click en inicio / Ejecutar
Ejecutamos gpedit.msc

Cuando aparezca la ventana de [Directiva de Grupo]
Dentro de la rama de Configuración del Equipo expandir [Planillas Administrativas] y seleccionar [Sistema]. En la parte derecha seleccionamos [Desactivar Reproducción Automática] y hacemos doble clic.
Cuando aparezca la ventana [Propiedades de Desactivar Reproducción Automática] hacemos click en "habilitada". Debajo, en la opción [Desactivar Reproducción Automática en:] elegimos [Todas las Unidades]

Tengan en cuenta que si navegan (= usar MI PC) el pendrive sin la opción "carpetas" (o sea haciendo doble click en cada lugar al que desean ingresar) cuando lo hagan sobre el pendrive también se ejecutara el código.

2- Revisar si tu pendrive tiene virus (o alguno que insertes ya con tu equipo seguro)
Para esto debes habilitar la vista de archivos ocultos y de sistema.
Abres MI PC -> Menu Herramientas -> Opciones de carpeta -> Ver
Allí activa las opción "Mostrar archivos ocultos"
Y desactiva la opción "Ocultar archivos protegidos del sistema operativo"

Listo, ahora cuando navegues vas a ver algunas carpetas y archivos que antes no veías (se verán mas claros que los demás)
Ingresa al pendrive y si encuentras el archivo "autoru.inf" (esta en la raíz, no busques en otro lugar del pendrive) ábrelo, veras algo como

Open=Recycler/ueiy928739ye9ye7832.exe

Ese archivo (el que indica "OPEN=") debes buscarlo y eliminarlo, en general si hay una carpeta RECYCLER en el pendrive debes eliminarla, los pendrive no tienen papelera y lo que eliminas se pierde para siempre.
Asi como también eliminar el archivo "autorin.inf"

Listo el pendrive ya esta limpio.
No olvides revisar cada pendrive que insertas.
Tampoco creas que cada archivo oculto o de sistema es un virus, tener activada esta vista implica conocer que borrar y que no

Ahora para entretenerte puedes leer los siguientes post de este blog

Meando autos
Dr. House
La triste verdad de windows
No robarás

de nada ...

rr

Nueva caracteristica de google (con fallas)

Encuentre las diferencias ...

Google Chrome en windows 7

Traduccion: Microsoft y Google no estan pasando por un buen momento en su relacion

Libros libres

Extraído de libroslibres.com ...!?

"• Enviar a miguel@libroslibres.com un resumen de la obra, el índice y el primer capítulo del manuscrito. Todo ello debe estar en formato word . Rogamos que adjunte también un currículo actualizado."

Además tiene un divertido aviso legal

" ... Quedan expresamente prohibidas, en todo caso, la reproducción, copia, comunicación pública, distribución, modificación, transformación, supresión, manipulación, y cualquier otra forma de utilización, con o sin ánimo de lucro, de todo o parte de esta página web o cualquiera de sus contenidos ..."

Si le agregas un ".mx" al final veras a una comunidad que libera físicamente los libros, o sea trata de que nos los mantengas guardados toda la vida

Finalmente si quieres leer libros "libres" (pensaba que no hacia falta explicarlo pero me refiero los que se pueden leer, descargar y/o reutilizar libremente) pueden ingresar a:

http://es.wikib feb ooks.org/wiki/Portada
En realidad pueden escribirlos, hay muchos incompletos para continuar y colaborar

Además en http://www.escolar.net/wiki/index.php/Libros

Otros con nombres interesantes (para regalar):
Curso de Linux para novatos, brutos y extremadamente torpes

En general hay mas información sobre copyleft y libertad que libros libres realmente
Es como decir que mas escotes que tetas

Actualización ( 9 feb 09)
El de google es interesante

Actualización 30/03/09
E-books diectory sirve también

rr

Google-babel. Nuevo juego de google

objetivo: encuentre el renglon que no corresponde
(a la quinta vez que mo hizo me canse y lo muestro ¿que pasa con google ultimamente ...?

gnusiervos

Suscribe via email

Etiquetas

auspician gnusiervos

ultimos posts