论文标题
Seplyitàperla ricerca dil dominio di una frase
Similarità per la ricerca del dominio di una frase
论文作者
论文摘要
英语。本文档旨在通过比较计算两个向量之间的距离的不同方法来研究最佳算法,以验证特定文档归属于相关域。在Apache Spark Framework提供的结构的帮助下,这项研究成为可能。从Massimiliano Morrelli等人的出版物“文本分类:大数据和分布的微积分”出版物中的研究开始,我们想对能够使用分布式环境来计算句子相似性的解决方案进行研究。 意大利裔。 Il presente documento persegue l'obiettivo di studiare gli algoritmi migliori per verificare l'appartenenza di un determinato documento a un relativo dominio tramite un confronto di diversi metodi per il calcolo della distanza fra due vettori. TaleStudioèStatoCondotto Con L'Ausilio delle Strutture asse disposizione dal Framework apache spark。 Partendo Dallo Studio Illustrato Nella Pubblicazione“ Nuova Frontiera delliera dellecificazione testuale:大数据e Calcolo Distribliato” Di Massimiliano Morrelli等Sfruttando l'Ambiente Distribuito。
English. This document aims to study the best algorithms to verify the belonging of a specific document to a related domain by comparing different methods for calculating the distance between two vectors. This study has been made possible with the help of the structures made available by the Apache Spark framework. Starting from the study illustrated in the publication "New frontier of textual classification: Big data and distributed calculus" by Massimiliano Morrelli et al., We wanted to carry out a study on the possible implementation of a solution capable of calculating the Similarity of a sentence using the distributed environment. Italiano. Il presente documento persegue l'obiettivo di studiare gli algoritmi migliori per verificare l'appartenenza di un determinato documento a un relativo dominio tramite un confronto di diversi metodi per il calcolo della distanza fra due vettori. Tale studio è stato condotto con l'ausilio delle strutture messe a disposizione dal framework Apache Spark. Partendo dallo studio illustrato nella pubblicazione "Nuova frontiera della classificazione testuale: Big data e calcolo distribuito" di Massimiliano Morrelli et al., si è voluto realizzare uno studio sulla possibile implementazione di una soluzione in grado di calcolare la Similarità di una frase sfruttando l'ambiente distribuito.