La lematización en español: Una aplicación para la recuperación de información ∥ Gómez Diaz, Raquel
通常価格:¥7,040
税込
商品コード: 163992
商品コード(SBC): 163992
-----------------------------------
ISBN13: 9788497041867
-----------------------------------
サイズ: 15.5 x 22 x 1.5 cm
-----------------------------------
頁 数: 239 pgs.
-----------------------------------
装 丁: paper cover
-----------------------------------
出版社: Trea, Ediciones
-----------------------------------
発行年: 2005
-----------------------------------
発行地: Gijon
-----------------------------------
双書名: Biblioteconomia y Administración Cultural, 125 追加情報:
※ 詳細PDFリンク
※ スペイン語のレマ化技術を情報検索へ応用し、言語処理の可能性を切り拓く実践的研究書 ※
本書は、スペイン語の語形を基底形へと統一するレマ化(lemmatización)の理論と手法を体系的に整理し、その成果を情報検索システムに応用するプロセスを詳細に示す語学研究書です。語彙の多様な屈折形を扱うスペイン語において、レマ化が検索精度向上にどのように寄与するのかを、形態論的分析・アルゴリズム設計・実験的検証を通して明らかにしています。また、語形変化の規則性や例外処理、語彙資源の構築方法、自然言語処理との連携など、実装に必要な要素を具体的に解説し、言語学と計算処理の架橋を目指す内容となっています。さらに、情報検索の実際の課題に即した応用例を提示し、レマ化技術が検索効率や結果の関連性に与える影響を実証的に示しています。スペイン語の形態論研究と情報処理技術を結びつける本書は、言語資源開発や検索システム設計に携わる研究者にとって有用な指針となる一冊です。
[対象地域、研究分野]
対象地域はスペイン語圏です。研究分野は形態論、自然言語処理、情報検索、計算言語学です。スペイン語学研究者、NLP研究者、情報検索システム開発者、関連分野の大学院生等を対象としています。
※ タイトルページ、目次、プロローグなどは「追加情報」のPDFをご参照下さい。
Description:
Este libro se enmarca dentro de la recuperación de información; en él se hace la revisión de los trabajos más importantes de este campo, analizando con mayor detenimiento la lematización y mostrando cómo se ha creado y los resultados que se pueden obtener con un lematizador para el español.
La lematización es un sistema inscrito en el nivel morfológico del procesamiento del lenguaje natural que pretende normalizar de manera automática los términos pertenecientes a una misma familia y, por tanto, próximos en significado, reduciéndolos a una forma común o lema. Su objetivo principal es obtener en el mínimo número de caracteres posibles el máximo de información del término. La lematización que se ha aplicado a distintos idiomas permitirá obtener mejoras en los resultados de la recuperación.
EL libro está destinado a profesionales de la información y la documentación y al público en general que, sin ser conocedores del tema, necesiten iniciarse en la recuperación de la información bien por su trabajo, estudio o simple curiosidad.
INDICE:
Prologo......21
Introduccion......25
Parte I: La recuperacion de la informacion......31
1. Concepto de recuperacion de informacion......33
2. Historia de la R. I.......37
3. Los modelos de R. I. ......49
4. Las palabras vacias en la R.I. ......81
5. La evaluacion de la R.I. ......83
6. La R.I. en español: experimentos mas significativos......105
Parte II: La lematizacion......115
7. La lematizacion......117
8. Tipos de algoritmos de lematizacion......125
9. Problemas de la lematizacion......131
10. La evaluacion de los sistemas de la lematizacion......133
11. Principales algoritmos de lematizacion para el ingles......137
12. La lematizacion en idiomas distintos del ingles......143
13. La lematizacion en español......147
Parte III: Un Lematizador para el español ......149
14. El lematizador para el español......151
15. La formacion de palabras en español......153
16. Los automatas de estados finitos......161
17. Consideraciones previas a la creacion del lematizador......165
18. La creacion del lematizador......171
19. Aplicacion del lematizador a la R. I. ......183
20. La evaluacion de la lematizacion......191
21. Comparacion del lematizador del español con otros lematizadores......201
22. Otras aplicaciones de la lematizacion......205
Glosario de terminos......207
Anexos
Aneso I. Terminaciones flexivas y derivativas......215
Anexo II. Terminaciones flexivas......217
Anexo III. Lista de palabras vacias segun categorias gramaticales (vacias leve)......218
Anexo IV. Lista de palabras vacias segun categorias gramaticales y alta frecuencia de aparicion (vacias fuerte)......221
Bibliografia......227