Normal view MARC view ISBD view

Algoritmo fonético para detección de cadenas de texto duplicadas en el idioma español /

by López Pérez,Fredy
[ Artículo de Revista ] , Ingenierías Published by : Universidad de Medellin, (Medellin:) Physical details: pp. 127-138 27 cm. ISSN:1692-3324 Subject(s): DATOS -- COLOMBIA | FUNCIONES -- COLOMBIA | ALGORITMOS -- COLOMBIA Year: 2012 Artículo de Revista Item type: Artículo de Revista
Online resources:
Tags from this library:
No tags from this library for this title.
Log in to add tags.
    average rating: 0.0 (0 votes)
Location Call number Status Date due Barcode Item holds
Biblioteca Central
HEMEROTECA
Vol. 11, No. 20 (Enero-Junio, 2012) Revista Ingenierias (Browse shelf) Available R01189
Total holds: 0

Con frecuencia datos que deberían estar escritos de forma idéntica no lo están debido a errores ortográficos y tipográficos, variaciones en el orden de las palabras, uso de prefijos y sufijos, entre otros. Las técnicas fonéticas para detección de duplicados no están orientadas al idioma español, lo que dificulta la identificación y corrección de problemas como errores ortográficos en textos escritos en este idioma. En este artículo de investigación se propone un algoritmo denominado PhoneticSpanish parala detección de cadenas de texto duplicadas el cual considera la presencia de errores ortográficos en el idioma español. El algoritmo propuesto se comparó con nueve técnicas para la detección de duplicados. Los resultados del algoritmo fueron satisfactorios ya que se obtuvieron mejores resultados que las otras técnicas y evidencian oportunidades para mejorar el análisis de información en el idioma español.

There are no comments for this item.

Log in to your account to post a comment.

Click on an image to view it in the image viewer

HTML Editor - Full Version

CORPORACIÓN UNIVERSITARIA DE SABANETA, UNISABANETA

BIBLIOTECA

2015-2019

Languages: