Un sustantivo: dos personas El proyecto de XML-TEI Bible sigue adelante. Hace poco, codificando algunos capítulos de Lucas, me encontré este versículo (2:41): Como se observa, el evangelista referencia en un único sustantivo (padres) tanto a María (#per11) como José (#per12). Aunque ya había encontrado referencias similares, este caso me hizo recapacitar que estas dos personas con una relación tan clara y estrecha coaparecen referenciadas en un mismo sustantivo. Las Humanidades Digitales suelen crear grafos de personajes literarios utilizando la coaparición en algún tipo de unidad textual: escena, capítulo, párrafo… De hecho XML-TEI Bible ha estado investigando la coaparición de… Seguir leyendo »
Posts Categorized: Blog
Sending a Proposal to the DH Conference: Keep Calm and Carry On
Thanks to my work at the University of Würzburg I have been able to attend the last Digital Humanities (DH) Conference in Krakow and I am looking forward to be also at the DH Conference in Montreal this summer. The conference in Krakow was one of the best experiences in my academical career. I have been involved with the DH Conference in different roles: participant, co-author, first author and reviewer. Although my experiences is only of two years, I have thought about writing a post about the whole experience, specially for the people that would like to propose for the… Seguir leyendo »
Topic modeling: ¿qué, cómo, cuándo?
Topic modeling es una herramienta de análisis textual proveniente de la rama informática de Minería de datos que desde hace algunos años está cogiendo fuerza y atención en los círculos internacionales de Humanidades Digitales. En concreto en la cátedra de Filología Computacional de Würzburg, donde trabajo, topic modeling es ahora mismo el método más utilizado e investigado por encima de la estilometría o el análisis de rasgos lingüísticos provenientes de herramientas de PLN. Creo que también se utilizará cada vez más en la investigación de textos en español, así que he pensado que podría escribir una breve introducción a topic… Seguir leyendo »
Empirical cultural charts by Inglehart and Welzel
I want to start a new kind of short reviews about books that I want to encourage. The first one is Modernization, Cultural Change, and Democracy: The Human Development Sequence from Ronald Inglehart and Christian Welzel. I knew about this work from the book of Strange Maps, where the author shows this map, a two axis chart with different countries as dots: This two axis (similar to a PCA in stylometry) represent two synthetic dimensions based on the correlations of the answers about dozens of themes about ethics, citizenship, economy, etcetera. The two synthetic dimensions are: tradition vs. secular-rational, and… Seguir leyendo »
Graph – Network of The Lord of the Rings
Woah, Gandalf, Hobbits and the rest of the crew of The Lord of the Ring in hairy cloud with colors! Cool, but what is that? What does it mean? One of the techniques that the Digital Humanities is using to analyze literary texts is the network analysis. In this technique, people are represented as nodes in a graph their relations are represented as edge. One of the early and best known networks for Literature was presented by Moretti about some plays of Shakespeare: What do I mean with relation? Well, that is one of the best question to be answered…. Seguir leyendo »
Muchas novedades en Casa de Citas
Con el cambio del año Casa de Citas ha sufrido los cambios más profundos hasta la fecha. Hemos modificado y ampliado una enorme parte de la interfaz del usuario. El contenido sigue siendo igual, pero ahora se puede navegar y disfrutar más. En primer lugar, ha habido un rediseño de la web general, aunque se han mantenido los colores básicos del proyecto: En segundo lugar hemos simplificado y reorganizado las secciones, sin que eso signifique una reducción de posibilidades: Cita a ciegas: donde podemos serguir viendo citas aleatorias Cita del día: donde podemos ver las últimas citas lanzadas por nuestras… Seguir leyendo »
¿Y yo qué busco en este catálogo?
En muchas ocasiones nos ocurre que llegamos por primera vez a un recurso que analiza una información concreta, y no sabemos qué empezar a buscar para llegar a los datos reales. Eso mismo puede ocurrir cuando un usuario llega a un catálogo como nuestro Catálogo Hipertextual de Traducciones Anónimas al Castellano de los siglos XIV al XVI, en bibliotecas de España, Italia y Portugal. Porque, admitámoslo, a pocas personas se les ocurre a bote pronto qué obras medievales y renacentistas fueron traducidas anónimamente al castellano y cuyos ejemplares se encuentren en el sur de Europa. Incluso aunque lo sepamos podríamos… Seguir leyendo »
Catálogo Hipertextual de Traducciones Anónimas al Castellano
Nos alegramos de poder inaugurar un proyecto en el que llevamos algunos meses trabajando con nuestra colega Elisa Borsari: el Catálogo hipertextual de traducciones anónimas. Este catálogo describe pormenorizadamente aquellas obras mediavales traducidas anónimamente. De cada uno de los textos se aportan numersos datos bibliográficos, cronólogicos y textuales. En la siguiente imagen se puede ver una ficha del catálogo: El resultado final es una web dinámica cuya información es accesible de diferentes maneras. Podemos buscar en la caja superior derecha por los campos de autor, título y signatura. Pero también pueden realizarse búsquedas avanzadas aplicando uno o varios criterios: Toda… Seguir leyendo »
Expresiones regulares: unas buenas amigas
Os queremos presentar una enorme ayuda para cualquier tarea relacionada con texto en formato electrónico. Son fáciles de utilizar y nosotros las usamos continuamente: corpus, bases de datos, webs (en php), eBooks… Puede resultar obvio para algunos, pero yo las empecé a utilizar hace no demasiado y ahora son vitales. Las expresiones regulares son formas genéricas de representar texto: desde caracteres individuales hasta párrafos completos. Un ejemplo sencillo de expresión regular son los caracteres * y ? que se pueden utilizar en muchos corpus o web. Nosotros mismos, en nuestra guía de citas famosas Casa de Citas permitimos búsquedas con *;… Seguir leyendo »
La Gran Pregunta de Internet
Cualquier empresa que cree productos culturales (libros, periódicos, música, cine, fotografías) se enfrenta a la cuestión de Internet, que ha puesto en duda casi cualquier sistema de cobro hasta ahora conocido. Internet trajo consigo la gran pregunta de la industria cultural del siglo XXI: ¿Cómo consigo transformar el valor de mi producto en precio? Vamos a llamar a esta pregunta: La Gran Pregunta, con tres mayúsculas. Algunos intentan evadir esa respuesta, quieren regresar a un estadio anterior de la tecnología y limitar al máximo las copias (respuesta típica de la industria del cine o la música). Otros entienden que hay poco… Seguir leyendo »