Clarin PL litecoin live chart

abstract = {Las expresiones de múltiples palabras evaden una definición cerrada. Los lingüistas y los lingüistas computacionales se basan en la intuición o en las listas de compilación de los tipos MWE; Si bien es práctico, eso es científicamente y estéticamente insatisfactorio. Sin pretender resolver un problema teórico desalentador, proponemos un procedimiento de decisión que dirige a un lexicógrafo hacia la aceptación o el rechazo de un N-gramo como una unidad léxica: un árbol de decisión clasifica los N-gramos como MWE o no MWE. Tendrá éxito si está de acuerdo con el criterio de los hablantes nativos. Necesitamos un conjunto pequeño de características, lingüísticamente creíbles, para enfrentar la multiplicidad de árboles adecuados. La inducción del árbol de decisión funciona con un conjunto fijo de ejemplos de clasificación anotados, pero el material léxico para el reconocimiento de MWE es demasiado grande para hacer factible la anotación. Nos basamos en el muestreo estadísticamente significativo a pequeña escala y en la intuición. De algunos árboles de decisión producidos por prueba y error informados, seleccionamos uno que consideramos mejor en nuestras circunstancias. Ese árbol, desplegado en un proyecto de construcción wordnet a gran escala, nos permitió recopilar estadísticas confiables sobre su utilidad en el trabajo de los lexicógrafos. Nuestro objetivo: la expansión sistemática de un wordnet por decenas de miles de MWE de una manera tan libre de sesgos personales como sea posible.},

Las expresiones de múltiples palabras evaden una definición cerrada. Los lingüistas y los lingüistas computacionales se basan en la intuición o en las listas de compilación de los tipos MWE; Si bien es práctico, eso es científicamente y estéticamente insatisfactorio. Sin pretender resolver un problema teórico desalentador, proponemos un procedimiento de decisión que dirige a un lexicógrafo hacia la aceptación o el rechazo de un N-gramo como una unidad léxica: un árbol de decisión clasifica los N-gramos como MWE o no MWE. Tendrá éxito si está de acuerdo con el criterio de los hablantes nativos. Necesitamos un conjunto pequeño de características, lingüísticamente creíbles, para enfrentar la multiplicidad de árboles adecuados. La inducción del árbol de decisión funciona con un conjunto fijo de ejemplos de clasificación anotados, pero el material léxico para el reconocimiento de MWE es demasiado grande para hacer factible la anotación. Nos basamos en el muestreo estadísticamente significativo a pequeña escala y en la intuición. De algunos árboles de decisión producidos por prueba y error informados, seleccionamos uno que consideramos mejor en nuestras circunstancias. Ese árbol, desplegado en un proyecto de construcción wordnet a gran escala, nos permitió recopilar estadísticas confiables sobre su utilidad en el trabajo de los lexicógrafos. Nuestro objetivo: la expansión sistemática de un wordnet por decenas de miles de MWE de una manera tan libre de sesgos personales como sea posible.

abstract = {Los recursos léxicos se pueden aplicar en muchas tareas diferentes de Ingeniería del lenguaje natural, pero la tarea más fundamental es el reconocimiento de los sentidos de las palabras utilizadas en contextos de texto. El problema es difícil, aún no está completamente resuelto y los diferentes recursos léxicos brindaron un apoyo variado. Los recursos semánticos léxicos de CLARIN en polaco se basan en plWordNet, una gran red de palabras para polaco, como una estructura central que sirve de base para unir varios recursos de diferentes tipos. En este documento, se discuten varios métodos de desambiguación de Word Sense (en adelante WSD) desarrollados para polaco que utilizan plWordNet. Las descripciones de los sentidos textuales en el léxico tradicional se pueden comparar con los contextos de texto utilizando el algoritmo de Lesk para encontrar los mejores sentidos coincidentes. En el caso de una red de palabras, las relaciones léxico-semánticas proporcionan la descripción principal de los sentidos de las palabras. Por lo tanto, primero, nos adaptamos y aplicamos para pulir un método WSD basado en el Page Rank. De acuerdo con ello, las palabras de texto se asignan según sus sentidos en el gráfico de PLWordNet y el algoritmo de Page Rank se ejecuta para encontrar sentidos con las puntuaciones más altas. El método presenta resultados más bajos pero comparables a los reportados para el inglés. El análisis de errores mostró que los principales problemas son: distinciones de sentido granulosas en PLWordNet y un número limitado de conexiones entre palabras de diferentes partes del habla. En el segundo enfoque, se utilizó plWordNet expandido con el mapeo sobre los conceptos de ontología de SUMO. Se investigaron dos escenarios para WSD: desambiguación y desambiguación de dos pasos basadas en redes combinadas de plWordNet y SUMO. En el escenario anterior, primero se asignan conceptos SUMO a las palabras y se desambiguan los siguientes sentidos de PlWordNet. En este último, plWordNet y SUMO se combinan en una gran red que se utiliza a continuación para la desambiguación de los sentidos. Las fuentes de conocimiento adicionales utilizadas en WSD mejoraron el rendimiento. Se discutieron los resultados obtenidos y las posibles líneas adicionales de desarrollos.},

Los recursos léxicos se pueden aplicar en muchas tareas diferentes de Ingeniería del lenguaje natural, pero la tarea más fundamental es el reconocimiento de los sentidos de las palabras que se utilizan en contextos de texto. El problema es difícil, aún no está completamente resuelto y los diferentes recursos léxicos brindaron un apoyo variado. Los recursos semánticos léxicos de CLARIN en polaco se basan en plWordNet, una gran red de palabras para polaco, como una estructura central que sirve de base para unir varios recursos de diferentes tipos. En este documento, se discuten varios métodos de desambiguación de Word Sense (en adelante WSD) desarrollados para polaco que utilizan plWordNet. Las descripciones de los sentidos textuales en el léxico tradicional se pueden comparar con los contextos de texto utilizando el algoritmo de Lesk para encontrar los mejores sentidos coincidentes. En el caso de una red de palabras, las relaciones léxico-semánticas proporcionan la descripción principal de los sentidos de las palabras. Por lo tanto, primero, nos adaptamos y aplicamos para pulir un método WSD basado en el Page Rank. De acuerdo con esto, las palabras de texto se asignan según sus sentidos en el gráfico de PLWordNet y se ejecuta el algoritmo de Page Rank para encontrar los sentidos con las puntuaciones más altas. El método presenta resultados más bajos pero comparables a los reportados para el inglés. El análisis de errores mostró que los principales problemas son: distinciones de sentido granulosas en PLWordNet y un número limitado de conexiones entre palabras de diferentes partes del habla. En el segundo enfoque, se utilizó plWordNet expandido con el mapeo sobre los conceptos de ontología de SUMO. Se investigaron dos escenarios para WSD: desambiguación y desambiguación de dos pasos basadas en redes combinadas de plWordNet y SUMO. En el escenario anterior, primero se asignan conceptos SUMO a las palabras y se desambiguan los siguientes sentidos de PlWordNet. En este último, plWordNet y SUMO se combinan en una gran red que se utiliza a continuación para la desambiguación de los sentidos. Las fuentes de conocimiento adicionales utilizadas en WSD mejoraron el rendimiento. Se discutieron los resultados obtenidos y las posibles líneas de desarrollo adicionales.

banner