Posts Categorized: PLN

Topic modeling: ¿qué, cómo, cuándo?

Topic escuela

Topic modeling es una herramienta de análisis textual proveniente de la rama informática de Minería de datos que desde hace algunos años está cogiendo fuerza y atención en los círculos internacionales de Humanidades Digitales. En concreto en la cátedra de Filología Computacional de Würzburg, donde trabajo, topic modeling es ahora mismo el método más utilizado e investigado por encima de la estilometría o el análisis de rasgos lingüísticos provenientes de herramientas de PLN. Creo que también se utilizará cada vez más en la investigación de textos en español, así que he pensado que podría escribir una breve introducción a topic… Seguir leyendo »

Graph – Network of The Lord of the Rings

Network of The Lord of the Rings

Woah, Gandalf, Hobbits and the rest of the crew of The Lord of the Ring in hairy cloud with colors! Cool, but what is that? What does it mean? One of the techniques that the Digital Humanities is using to analyze literary texts is the network analysis. In this technique, people are represented as nodes in a graph their relations are represented as edge. One of the early and best known networks for Literature was presented by Moretti about some plays of Shakespeare: What do I mean with relation? Well, that is one of the best question to be answered…. Seguir leyendo »

Signos de exclamación e interrogación y las expresiones regulares mysql

Señalamos en el blog de Casa de Citas que hemos realizado mejoras de búsqueda. En este caso la diferencia de búsqueda es muy concreta y tiene un claro aspecto técnico que les puede venir bien a otras personas. En la siguiente imagen podéis ver a la izquierda los resultados que aparecían cuando antes buscábamos por la palabra soy; a la derecha los nuevos resultados: Como podéis ver, en la columna de la derecha aparecen nuevas citas que antes no encontrábamos. ¿Por qué antes se le escapaba a la búsqueda la cita «¿Soy? ¡Seré!»? La respuesta se encuentra en parte en… Seguir leyendo »

Expresiones regulares: unas buenas amigas

Os queremos presentar una enorme ayuda para cualquier tarea relacionada con texto en formato electrónico. Son fáciles de utilizar y nosotros las usamos continuamente: corpus, bases de datos, webs (en php), eBooks… Puede resultar obvio para algunos, pero yo las empecé a utilizar hace no demasiado y ahora son vitales. Las expresiones regulares son formas genéricas de representar texto: desde caracteres individuales hasta párrafos completos. Un ejemplo sencillo de expresión regular son los caracteres * y ? que se pueden utilizar en muchos corpus o web. Nosotros mismos, en nuestra guía de citas famosas Casa de Citas permitimos búsquedas con *;… Seguir leyendo »