El blog de los profesionales del mundo editorial

Categoría Curiosidades

reCaptcha, un sistema que te involucra en la digitalización de libros

Miércoles 23 de Julio de 2008

Un CAPTCHA es una de esas imágenes de palabras distorsionadas que muchas webs y blogs nos piden que descifremos para registrarnos o escribir un comentario. Su finalidad es distinguir si el usuario es humano o una máquina, para evitar los “bots”, los programas que generan spam de forma automática.

reCaptcha

Cada día se “resuelven” unos 60 millones de CAPTCHAs. Si sumamos los segundos que cada uno de nosotros empleamos en ello, resulta que entre todos consumimos unas 150.000 horas diarias descifrando CAPTCHAs.

reCAPTCHA es un proyecto de la School of Computer Science (Carnegie Mellon University) que canaliza todo ese esfuerzo humano para corregir los errores de digitalización de los textos escaneados con OCR.

OCR (Optical Character Recognition) es un programa que convierte en texto lasimágenes escaneadas de las páginas de un libro. Pero no es perfecto, y muchas veces confunde los caracteres, introduciendo errores. En estos casos, el programa lanza una alerta cuando no puede leer una palabra, y es aquí cuando empieza la labor de corrección de reCAPTCHA.

ejemplo de lectura de OCR

ejemplo error de lectura de OCR

reCAPTCHA ayuda a a mejorar la digitalización de libros enviando a la web estas palabras ilegibles en forma de CAPTCHAs, para que los humanos las descifren.

Sin embargo, si OCR no sabe cómo leer las palabras que luego se convierten en CAPTCHAs, ¿cómo sabe el sistema si el usuario ha dado la respuesta acertada? Las palabras son dadas al usuario en conjunción con otras que el sistema sí conoce. Si el usuario descifra correctamente ésta, el programa asume que también es correcta la otra. Para verificarlo, esta imagen se envía de nuevo a un número indeterminado de personas, y si sus respuestas coinciden el sistema validará la palabra sobre la que OCR dudaba.

reCaptcha images

reCAPTCHA colabora habitualmente con Internet Archive, que lleva a cabo una importante tarea de digitalización de libros. La ayuda de los usuarios es fundamental para poder llevar a cabo su objetivo, por lo que pide a todos aquellos que estén interesados en colaborar que instalen sus plugins de reCAPTCHA en sus webs o que utilicen su sistema Mailhide como método para reducir el spam.

Lost Book Club, ¿una nueva forma de fomentar la lectura?

Viernes 04 de Julio de 2008

Lost Book Club

Una de las varias rarezas que caracterizan a alguno de los protagonistas de Lost -la famosa serie americana sobre los supervivientes a un accidente aereo en una misteriosa isla- es que leen libros. Esta “curiosidad” pronto pasó a formar parte de las conversaciones de los fans en los foros, que abrían largas conversaciones sobre los títulos que leían los personajes.

Animada por este éxito, la cadena ABC ha abierto en la web de la serie el Lost Book Club, para que los fans puedan, además de hablar sobre los libros, ojearlos, leer una sinopsis, saber cuándo y cómo aparecieron en la serie e incluso leer las introducciones escritas por los creadores y productores de la serie Damon Lindelof y Carlton Cuse. Por supuesto, también se pueden comprar a través de la tienda de la ABC TV store.

De momento hay 31 títulos para todos los gustos, pero se prevé la incorporación de más. No vamos a entrar en una crítica sobre la selección de los productores y creativos de la serie (no por negativa, sino porque alargaría mucho este post), ni vamos a enumerar todos los títulos, pero aconsejamos echar un vistazo al pantallazo que os copiamos, en el que se ve la mayoría de ellos.

Lost Book Club - Books

La productora lo ve como un negocio. A nosotros nos parece una forma eficaz de fomentar la lectura. Quizá si los protagonistas de las series y culebrones hispanos leyeran algo de vez en cuando podríamos ver iniciativas similares en español.

Impresiones de The Independent sobre el sector editorial español

Miércoles 04 de Junio de 2008

Buscando las opiniones de la prensa extranjera sobre esa dicotomía auge/crisis del sector editorial español, encontramos esta perlita que firma una reportera de The Independent , enviada especial del periódico a la Feria del Libro de Madrid.

La copiamos y traducimos, porque no tiene desperdicio.

“La venta de casas se ha desplomado, la de automóviles no arranca y el crédito está estrangulado, pero España está viviendo un boom sin precedentes en la venta de libros. Si tiempo atrás fue el país que menos libros leía de Europa, ahora los españoles se han convertido en voraces lectores que devoran más libros que nunca.

El comercio de libros en España no sólo ha escapado a la recesión que sufre el resto de la economía sino que va al alza. Las editoriales dicen que las ventas del año pasado batieron todos los records, y predicen incluso mejores resultado para 2008. El sector se muestra eufórico en la Feria anual de Madrid, que abrió ayer. Las Ferias del Libro al aire libre se han convertido en espectáculos mediáticos, pero también en acontecimientos populares masificados donde los fans hacen cola para ver a su autor favorito y se aferran a los libros como consuelo en tiempos de incertidumbre.

La lectura de libros fue, durante mucho tiempo, pasatiempo de una minoría en un país donde la educación estaba reservada a una minúscula élite. Las tiradas eran mínimas, las librerías, el mohoso refugio de las clases pudientes, y en las críticas literarias se amañaban los artículos entre colegas.

A pesar del aumento de la alfabetización de los últimos años, los españoles eran reacios a adoptar hábitos lectores. No hace tanto que el 50% de la población decía que jamás había leído un libro y que tampoco los tenía en casa. Actualmente, el 57% afirma leer regularmente.

Este ha sido un año de grandes bestsellers: la última novela de Carlos Ruiz Zafón, El juego del ángel, se publicó en abril con la astronómica tirada de un millón de ejemplares, y ya está casi agotado. Y el éxito de Ken Follet, Un mundo sin fin, ambientado en Vitoria, la capital vasca, ha vendido más de un millón de copias desde su aparición en España el pasado diciembre.

Los grandes editores han obtenido enormes beneficios, pero también los han logrado los pequeños. ‘2007 ha sido el mejor año de nuestra historia’ dice Jorge Herralde, editor de la independiente Anagrama, ‘vendimos 14 millones de euros en libros, y esperamos crecer otro 5% este año’.”

 

John Doe over the world: Glosario del ciudadano desconocido

Jueves 13 de Marzo de 2008

Meet John Doe_poster

NationMaster es una web especializada en estadísticas por países que cuenta con una extensa base de datos. Su especialidad son las comparativas gráficas entre naciones (mapas y gráficos), que uno puede generar según sus intereses sobre la base de dichas estadísticas, y también cuenta con una completa enciclopedia con más de un millón de entradas.

Nos ha llamado la atención la entrada sobre John Doe. “John Doe” (también “Jane Doe” y “Baby Doe”) es el nombre con que se denomina a las personas de identidad desconocida en los procesos legales de Estados Unidos. También se utiliza esta denominación en hospitales y morgues.

Siguiendo su objetivo de cruzar datos entre países, NationMaster elabora una curiosa relación de los nombres que recibe ese John Doe, esa persona de identidad desconocida, en cada país.

Hemos hecho una adaptación al español que colgaremos en la web de ediciona, porque es demasiado larga para copiarla aquí. Pero dejamos unos cuantos países de muestra, como curiosidad:

España
Fulano de Tal, Pepe Pérez, Fulano, Fulanito, Mengano, Menganito, Perico de los Palotes, Fulanito de Tal, Menganito de Cual, Zutano, Zutanito, Sultano, Sultanito, Don Nadie, Juan Nadie, Perengano. Equivalente femeninos: Fulanita, Fulanita de Tal, Mengana, Menganita, Menganita de Tal.

Estados Unidos
John Doe, Jane Doe, John Q. Public, Joe Blow, Joe Schmoe, Joe Sixpack, John Smith, Eddie Punchclock (para trabajadores), Joe Botts (particularmente en Nueva York), J. S. Ragman (U. S. Navy).

Filipinas
Juan de la Cruz, Juanita de la Cruz.

Francia
Jean Dupont, Paul Martin, Monsieur Durand, Monsieur Untel/ Madame Unetelle, Monsieur/Madame X, Pierre-Paul-Jacques (pronunciados como si fueran un único nombre; a veces se les añade un “o” en el centro: “Pierre-Paul-ou-Jacques”)

Israel
Israel Israeli y también Ploni o Almoni, o la combinación de estos últimos: Ploni Almoni (tomado de Ruth 4:1, donde se usa en lugar del verdadero nombre del pariente de Boaz cuyo nombre se omite por no haber observado el precepto del levirato).

Japón
Yamada Taroa (nombre masculino muy corriente), Yamada Hanako (nombre femenino muy corriente), Nanashi-no-Gombei (literalmente “Sin nombre Tal y cual”), Nanno Nanigashi, Dozaemon (cuerpo ahogado).

BookLamp, una web que encuentra libros a tu medida

Martes 11 de Marzo de 2008

BookLamp_logo

A través de Tomy nos llega la noticia de que hoy se estrena la beta de un curioso proyecto: BookLamp.

Se trata de un programa que analiza el estilo de un texto y busca en su base de datos otros textos cuyos parámetros coincidan con los analizados (ritmo, o longitud de los párrafos; densidad, o complejidad del texto; acción, o grado de movimiento físico; lenguaje descriptivo y diálogo). En palabras de la propia web: un emparejador de libros y lectores.

“BookLamp.org es un sistema que empareja libros y lectores a través del análisis del estilo literario, de forma parecida a la que usa Pandora.com para emparejar a amantes de la música con la música nueva.

¿Te gustó It de Stephen King, pero te pareció demasiado largo? La tecnología de BookLamp te permite encontrar libros escritos con similar tono, tiempo, perspectiva y con similares niveles de acción, descripción y diálogo, a la vez que te permite especificar detalles como que lo quieres más corto. Es insensible a las influencias externas, como la publicidad, que impactan socialmente y conducen a un sistema de recomnedaciones y no depende de las opiniones de otros usuarios.”

BookLamp_gráficos

BookLamp_matching

O sea, algo similar al famoso apartado de Amazon “los lectores que compraron este libro también compraron estos otros”, pero con base científica.

Lo que es muy interesante es la propuesta de utilidad de este sistema que se hace en la propia web: the Publisher’s Project.

“Consiste en un sistema que permite a los escritores que aún no han publicado subir sus manuscritos a BookLamp para su análisis y comparación con libros ya publicados. Una vez analizado el texto, se cruzan los datos con los existentes de libros publicados y se enlaza los resultados con los catálogos de editores y agentes literarios. En otras palabras, te dice qué editores y qué agentes publican y gestionan libros de estilo literario semejante al tuyo.

También se da a editores y agentes la posibilidad de suscribirse a las “Alertas al editor”, un mensaje de correo electrónico que les avisa cuando algún manuscrito que coincide en género y estilo con sus especificaciones es subido a la web por un escritor.”

La curiosidad: BookLamp aún no existe, porque aún no tiene una base de libros digitalizados sobre los que poder trabajar. Así que está pidendo opiniones a los usarios sobre si les parece interesante como servicio, sobre los libros que les gustaría ver escaneados, en incluso sobre si creen que deberían asociarse con alguna empresa con base de datos de libros, o trabajar en formato open source.

American business and marketing style.

¿Castigo ejemplar o idealismo bienintencionado?

Lunes 03 de Marzo de 2008

Chavales

Juzguen por sí mismos.

«Los menores infractores de Madrid purgarán su falta traduciendo al inglés grandes obras de la literatura universal.

El vicepresidente segundo y consejero de Justicia de la Comunidad de Madrid, Alfredo Prada, ha anunciado la creación de talleres centrados “en la traducción al inglés de grandes obras de la Literatura universal” en los 13 centros para la reeducación y reinserción de menores infractores de la Comunidad de Madrid, según informó el Ejecutivo regional.

Esta iniciativa trata de inculcar en los jóvenes sometidos a medidas judiciales una reflexión sobre la vida a través de grandes obras de la Literatura. Los educadores trabajan sobre una obra determinada, analizan el mensaje que transmite la narración, poesía, novela, crónica o teatro y posteriormente comienzan la traducción de estas obras al inglés.

El vicepresidente destacó que “el 83% de los jóvenes infractores no reinciden en el delito” y que “los jóvenes delincuentes salen rehabilitados y tienen la posibilidad de hacer incluso estudios universitarios”. Según las cifras que maneja actualmente, hay “468 menores en los centros de la comunidad” y “cada vez hay más jóvenes que cometen delitos según la Fiscalía, especialmente de robo con fuerza”. Prada destacó que existen “numerosas empresas privadas en el Programa Madrid Joven Integra que ofrecen puestos de trabajo para estos jóvenes” y que algunos ayuntamientos “muestran una solidaridad con mayúsculas, aunque no tengan la competencia en esta materia”.

Asimismo, aprovechó este acto para presentar el libro con el que dará comienzo este programa de formación, con los Breviarios del Rey Lear, de Charles Lamb, que recibirán todos los jóvenes que estén en los centros. Se trata de un cuento basado en la obra de Shakespeare con el que se pretende “conducir a los jóvenes a sacar sus propias lecturas sobre las tragedias y las comedias de la vida”.»

Una vez pasado el desconcierto inicial, las pregunta son muchas: ¿Por qué se les obliga a traducir al inglés? ¿No sería más provechoso para los chicos hacerlo del inglés al castellano y mejorar la expresión y ortografía en su propia lengua? La tasa de no reincidencia ¿se debe a la dureza del castigo o a esas reflexiones sobre la vida? ¿De verdad que el hecho de traducir un libro capacita para seguir estudios universitarios?

Tenemos serias dudas, pero el simple hecho de intentar la rehabilitación por esta vía es una iniciativa digna de aplauso.

Vía La crónica social. Artículo de Miguel Ángel López

Autores más leídos y autores más comprados en 2007

Lunes 18 de Febrero de 2008

Autores más leídos y comprados de 2007

Según el Barómetro de hábitos de lectura y compra de libros de 2007, elaborado por encargo de la Federación de Gremios de Editores de España, estos son los veinticinco autores más vendidos y más leídos de 2007.

El estudio no da detalles sobre los “más leídos”, así que damos por supuesto que se trata de préstamos bibliotecarios, préstamos entre amigos y libro leídos o bajados de Internet. Y pese a hacer una comparación en tablas paralelas, tampoco establece ningún tipo conclusión al respecto. Curiosamente, un cosa no siempre coincide con la otra.

Sólo una cuarta parte son tan leídos como vendidos: los cuatro primeros (Dan Brown, Ildefonso Falcones, Ken Follet y Carlos Ruíz Zafón) y los puestos número 16 (Arthur Golden) y 18 (Jean M. Auel).

Nueve son más leídos que comprados: Arturo Pérez Reverte, Matilde Asensi, Isabel Allende, Cervantes, Noah Gordon, Patrick Süskind, Almudena Grandes, Katherine Neville y Diane Setterfield. La mayoría tiene descensos poco significativos, salvo Noah Gordon, número 10 entre los más leídos, que baja diez puestos en la lista de los más comprados.

Siete son más comprados que leídos: Julia Navarro., J.K. Rowling, John Boyne, Gabriel García Márquez, J.R.R. Tolkien, Paulo Coelho y Stephen King. Este último sube del puesto número 25 entre los más leídos al 17 de los más comprados.

Y otra curiosidad, hay tres autores muy leídos pero que no están en el top 25 de los más comprados: Antonio Gala, Benito Pérez Galdós y J.J. Benítez. Y otros tres autores muy comprados, pero poco leídos: Eduard Punset, Jorge Bucay y Javier Moro.

Casualmente, Punset está también entre los autores más devueltos después de Navidad, así como El niño del pijama a rayas, de John Boyne, que está entre los más comprados que leídos (según Xavi Ayén en su artículo “Los regalos culturales no queridos“, La Vanguardia, 12 de enero de 2007). Quizá ello sea argumento para concluir que posiblemente es mejor estar entre los más leídos que entre los más vendidos.

En cuanto a la lengua que escriben estos autores, la mitad lo hacen en español y la otra mitad son traducidos. Y salvo Cervantes y Galdós, todos son autores nacidos en el siglo XX.

DS Novel, posiblemente un nuevo lector de e-books

Miércoles 06 de Febrero de 2008

Nintendo ds

Nintendo prepara para Europa una nueva utilidad dentro de la sección de “no juegos” de la compañía (la rentable y popular Touch! Generations): la DS Novel.

Poco se sabe, salvo que podría tratarse de una adaptación de la DS Bungaku Zenshuu, exclusiva para Japón: cien obras literarias clásicas japonesas, que se leían con la consola en posición vertical, como un libro. Por lo que, previsiblemente, podría incluir un sistema de descargas y compra digital similar a la de Amazon para el Kindle.

¿Qué tipo novelas podrán descargarse? ¿A qué publico irán dirigidas? Habrá que esperar a final de año para averiguarlo.

Sobre dos colecciones de Tusquets editores

Miércoles 02 de Enero de 2008

Tusquets editores_logo Tusquets editores_mosca

Observando en una estantería los libros de John Irving, un autor fascinante, se observa una «curiosidad editorial».

Tusquets Editores, la editorial barcelonesa que tiene la exclusiva de este autor, distribuye los títulos de éste en dos colecciones: Andanzas y Fábula.

Según la web de la editorial, Andanzas, con 752 títulos, es «Para quienes aman leer sin perder el tiempo [...] Ofrece ante todo buenas novelas de autores de ayer y de hoy, conocidos y consagrados o absolutamente desconocidos. Son libros gratos y gratificantes no sólo en el acto de la lectura, sino también en el recuerdo, en la memoria. “Un libro es una prolongada nota biográfica”, afirma Paul Theroux . . .». En cuanto a la colección Fábula, se compone de 282 títulos, «los mejores títulos de nuestro fondo editorial, con algunas incorporaciones de otros catálogos, en formato de bolsillo y a precio de fábula».

Hasta aquí todo correcto. La curiosidad se observa al comparar las ediciones del mismo título en cada una de las colecciones, por ejemplo El mundo según Garp.

En la colección Fábula está encuadernado en rústica sin solapas y mide 194 mm x 122 mm. Tiene 512 páginas, unos márgenes casi inexistentes, un interlineado al límite y una letra medida “mi reino por una lupa”. Normal, es el equivalente a la edición de bolsillo.

Pero resulta que el mismo título, en la colección Andanzas, es sólo un centímetro y medio más ancho y más alto, tiene sólo ocho páginas más (520), los márgenes siguen siendo escasos, el interlineado sigue desmotivando y el cuerpo de la letra, si no pide lupa, pide unas gafas. Eso sí, tiene solapas, el cartón de la cubierta es más grueso y vale algo más del doble. Y parece una enorme colección de bolsillo.

¿Dónde está lógica?

Parece Patraña Pero Pinta Posible

Jueves 27 de Diciembre de 2007

Alfabeto cirílico

Nikolái Kultiápov es un escritor (?) ruso que tiene entre sus méritos ser ex coronel del FSB (Servicio Federal de Seguridad, heredero del KGB) y haber entrado en el libro Guiness de los records por haber escrito un libro, La isla de Olga, compuesto por 16.000 palabras que empiezan por la letra O y de las cuales ninguna se repite más de cuatro veces.

No contento con tal proeza, ahora amenaza al mundo con escribir otro, Las aventuras del soldado de infantería Pavel Petrov, compuesto por ¡40.000! palabras que empiezan por la letra P y sólo por la letra P.

Por lo visto, la proeza no es tanto como parece, ya que el idioma ruso permite semejantes experimentos y Kultiápov no es el primero que emplea su tiempo en tales excentricidades.

Sin embargo, parece ser que de nada le ha servido tener un inmenso vocabulario con la O, ya que La isla de Olga prácticamente no se vendió, y Kultiápov va regalando ejemplares a bibliotecas nacionales y extranjeras, instituciones e incluso a Putin.

Quizá la P le traiga más suerte. Puede Pasar.

Fomento de la lectura a la americana

Sábado 22 de Diciembre de 2007

Biblioteca de Kansas City

A los americanos les gustan las cosas a lo grande, y si se trata de reclamos publicitarios más.

Para promocionar la Biblioteca Central de Kansas City, se decidió recubrir los muros del parking con las gigantescas imágenes de 22 lomos de libros, con la idea de representar una “estantería común”. Los títulos fueron escogidos entre aquellos que los ciudadanos consideran que mejor representan a la ciudad (?). Los anotamos en su versión castellana:

Romeo y Julieta, de William Shakespeare (1569)
La telaraña de Carlota, de E.B. White (1952)
Historia de dos ciudades, de Charles Dickens (1859)
El señor de los anillos, de J.R.R. Tolkien (1954-1956)
Matar a un ruiseñor, de Harper Lee (1960)
El hombre invisible, de Ralph Ellison (1952)
Fahrenheit 451, de ray Bradbury (1953)
Primavera silenciosa, de Rachel Carson (1962)
Trampa 22, de Joseph Heller (1961)
Pioneros, Willa Cather (1913)
Cuentos infantiles, de Autores Varios
Historias de Kansas City, vols. I y II, de Autores Varios
Alce Negro habla, de John Neihardt (1932)
Poemas selectos, de Langston Hughes (1994)
Tao te ching, de Lao Tse (s. III-IV a.C)
Truman, de David McCullough (1992)
Cien años de soledad, de Gabriel García Márquez (1967)
Las aventuras de Huckleberry Finn, de Mark Twain (1884)
Journals of Lewis and Clark, de Merywether Lewis (1804-1806)
La República, de Platón (s. IV a.C)

El libro más raro del mundo

Martes 18 de Diciembre de 2007

Moisés rompiendo las Tablas de la Ley

Vía El documentalista enredado

“Según el punto de vista de la Bibliofilia, el libro más raro jamás escrito sería, sin lugar a dudas, las Tablas de la Ley que Yahvé entregó a Moisés en el Monte del Sinaí. Por…

- La importancia del autor, que no admite competencia.
- La trascendencia del texto, una ley moral para la mayoría de la Humanidad.
- La antigüedad.
- La materia escritoria (Piedra).
- Su carácter de ejemplar único.
- El hecho de haber sido destruido, aunque posteriormente Yahvé ordenó a Moisés que labrara otras dos tablas y reescribiera el decálogo.

Extraído: MENDOZA DIAZ-MAROTO, Francisco. La pasión por los libros. Madrid: Espasa Calpe, 2002. P. 185″