Algoritmo fonético para detección de cadenas de texto duplicadas en el idioma español / (Record no. 12422)

000 -LEADER
fixed length control field 02174nab a22002777a 4500
007 - PHYSICAL DESCRIPTION FIXED FIELD--GENERAL INFORMATION
fixed length control field ta
008 - FIXED-LENGTH DATA ELEMENTS--GENERAL INFORMATION
fixed length control field 190924i xxugr|perm||| 00| 0 spa d
022 ## - INTERNATIONAL STANDARD SERIAL NUMBER
International Standard Serial Number 1692-3324
096 ## - LOCALLY ASSIGNED NLM-TYPE CALL NUMBER (OCLC)
Classification number Vol. 11, No. 20 (Enero-Junio, 2012)
Item number Revista Ingenierías
773 0# - HOST ITEM ENTRY
-- 12309
-- 13184
100 ## - MAIN ENTRY--PERSONAL NAME
9 (RLIN) 26837
Personal name López Pérez,Fredy
Relator term Autor
240 ## - UNIFORM TITLE
Uniform title Ingenierías
245 ## - TITLE STATEMENT
Title Algoritmo fonético para detección de cadenas de texto duplicadas en el idioma español /
Statement of responsibility, etc Iván Amón, Francisco Moreno y Jaime Echeverri
260 ## - PUBLICATION, DISTRIBUTION, ETC. (IMPRINT)
Place of publication, distribution, etc Medellin:
Name of publisher, distributor, etc Universidad de Medellin,
Date of publication, distribution, etc 2012.
300 ## - PHYSICAL DESCRIPTION
Extent pp. 127-138
Dimensions 27 cm.
310 ## - CURRENT PUBLICATION FREQUENCY
Current publication frequency Semestral
362 ## - DATES OF PUBLICATION AND/OR SEQUENTIAL DESIGNATION
Dates of publication and/or sequential designation Vol. 11, No. 20 (Enero-Junio, 2012)
520 ## - SUMMARY, ETC.
Summary, etc Con frecuencia datos que deberían estar escritos de forma idéntica no lo están debido a errores ortográficos y tipográficos, variaciones en el orden de las palabras, uso de prefijos y sufijos, entre otros. Las técnicas fonéticas para detección de duplicados no están orientadas al idioma español, lo que dificulta la identificación y corrección de problemas como errores ortográficos en textos escritos en este idioma. En este artículo de investigación se propone un algoritmo denominado PhoneticSpanish parala detección de cadenas de texto duplicadas el cual considera la presencia de errores ortográficos en el idioma español. El algoritmo propuesto se comparó con nueve técnicas para la detección de duplicados. Los resultados del algoritmo fueron satisfactorios ya que se obtuvieron mejores resultados que las otras técnicas y evidencian oportunidades para mejorar el análisis de información en el idioma español.
650 ## - SUBJECT ADDED ENTRY--TOPICAL TERM
9 (RLIN) 9510
Topical term or geographic name as entry element DATOS
Geographic subdivision COLOMBIA
650 ## - SUBJECT ADDED ENTRY--TOPICAL TERM
9 (RLIN) 11167
Topical term or geographic name as entry element FUNCIONES
Geographic subdivision COLOMBIA
650 ## - SUBJECT ADDED ENTRY--TOPICAL TERM
9 (RLIN) 8208
Topical term or geographic name as entry element ALGORITMOS
Geographic subdivision COLOMBIA
773 ## - HOST ITEM ENTRY
Title Ingenierías
International Standard Serial Number 1692-3324
776 ## - ADDITIONAL PHYSICAL FORM ENTRY
Title Ingenierías
International Standard Serial Number 1692-3324
773 0# - HOST ITEM ENTRY
Main entry heading López Pérez,Fredy
Edition
Place, publisher, and date of publication Medellin: Universidad de medellin 2013
Other item identifier R01189
Title Ingenierias /
Record control number
International Standard Serial Number 1692-3324
International Standard Book Number
856 ## - ELECTRONIC LOCATION AND ACCESS
Uniform Resource Identifier https://revistas.udem.edu.co/index.php/ingenierias/article/view/671
Link text Algoritmo fonético para detección de cadenas de texto duplicadas en el idioma español
Public note Dar clic para acceder artículo en línea
942 ## - ADDED ENTRY ELEMENTS (KOHA)
Source of classification or shelving scheme
Koha item type Artículo de Revista

No copies available.

HTML Editor - Full Version

CORPORACIÓN UNIVERSITARIA DE SABANETA, UNISABANETA

BIBLIOTECA

2015-2019

Languages: