|
Abstract:
|
Este artículo describe investigación sobre los efectos de la desambiguación morfosintáctica usada como un preproceso de un analizador sintáctico profundo basado enHPSG, en el contexto del desarrollo de un treebank del español de código abierto, en elentorno de DELPH-IN. La anotación treebank se realiza manualmente tomando las decisionesapropiadas entre las opciones propuestas por el sistema y ordenadas por un móduloestadístico. Los experimentos presentados muestran que el uso de un etiquetador reducela ambigüedad de las frases, y contribuye a limitar la cantidad de frases cuyo análisis sobrepasa el límite de tiempo, y ayuda a al módulo estadístico a clasificar el árbol correcto entre los mejores. Por un lado, nuestros resultados validan los beneficios ya reportados en la literatura de tal preproceso de análisis profundo con respecto a la velocidad, cobertura y precisión. Por otro lado, proponemos una estrategia basada en existentes herramientas de código abierto y recursos para desarrollar con alta consitencia treebanks de sintaxis profundapara idiomas con limitada disponibilidad de recursos lingüísticos. |