Featre selection on large-scale issues using clustering and meta-algorithms

Fardin Akhlaghian Tab; Shabnam Amiri

v. 7 n. 13 (2018)

Articles

Seleção de recursos em problemas de larga escala usando clustering e meta-algoritmos

pdf (English)

Fardin Akhlaghian Tab,
Shabnam Amiri

mais informações

Fardin Akhlaghian Tab
Faculty of Communication and Modern Languages Universiti Putra Malaysia (UPM)
Biografia do Autor

English Language Department, Faculty of Communication and Modern Languages
Universiti Putra Malaysia (UPM)

Shabnam Amiri
Faculty of Communication and Modern Languages Universiti Putra Malaysia (UPM)
Biografia do Autor

English Language Department, Faculty of Communication and Modern Languages
Universiti Putra Malaysia (UPM)

Publicado 2018-04-30

Palavras-chave

Selección de funciones, clustering y meta-algoritmos.

Como Citar

Tab, F. A., & Amiri, S. (2018). Seleção de recursos em problemas de larga escala usando clustering e meta-algoritmos. Amazonia Investiga, 7(13), 17–30. Recuperado de https://amazoniainvestiga.info/index.php/amazonia/article/view/490

Resumo

A seleção de recursos de entrada apropriados no aumento da eficiência dos algoritmos de mineração de dados tem um efeito direto e significativo. Mais precisamente, essa extração de conhecimento dos dados de problemas é facilitada por três coisas: redução de volumes de dados, eliminação de recursos duplicados e eliminação de recursos não relacionados. Dada essa necessidade, uma extensa pesquisa foi realizada nos últimos anos com uma variedade de tendências (estatística, algorítmica e aprendizagem) a esse respeito. Nesse meio tempo, hiper-algoritmos como algoritmos genéticos têm sido considerados por muitos pesquisadores. Nesta pesquisa, tentamos obter mais eficiência combinando algoritmos de agrupamento e genéticos e reduzindo o tempo computacional.
A este respeito, uma nova representação do algoritmo genético correspondente a este problema é apresentada e seus operadores são apropriadamente definidos. Além disso, para o uso eficiente de clustering neste estudo, foi necessário fornecer um algoritmo relativamente novo para clustering rápido. Para validar os métodos propostos e determinar sua eficiência na solução de problemas reais, vários experimentos foram realizados em dados padrão. Na próxima etapa, analisando os métodos propostos, comparamos os resultados dos experimentos com vários algoritmos reportados em artigos novos e válidos. Essas comparações mostraram melhorias na eficiência dos métodos propostos em termos de precisão de categorização e redução de recursos em comparação com os métodos concorrentes. De acordo com a análise, essa melhoria deveu-se ao efeito positivo do agrupamento em uma busca mais rápida do espaço do problema pelo algoritmo genético e exibição adaptada.

pdf (English)

Downloads

Não há dados estatísticos.

Referências

Alexandridis, A., Patrinos, P., Sarimveis, H., & Tsekouras, G, (2005), A two-stage evolutionary algorithm for variable selection in the development of RBF neural network models. Chemometrics and Intelligent Laboratory Systems, 75(2), 149-162. doi: http://dx.doi.org/10.1016/j.chemolab.2004.06.004

Bekkerman, R., El-Yaniv, R., Tishby, N., & Winter, Y. (2003). Distributional word clusters vs. words for text categorization. J. Mach. Learn. Res., 3, 1183-1208 .

Blum, A. L., & Langley, P, (1997), Selection of relevant features and examples in machine learning. Artif. Intell., 97(1-2), 245-271. doi: 10.1016/s0004-3702(97)00063-5

Chuang, L.-Y., Chang, H.-W., Tu, C.-J., & Yang, C.-H, (2008), Improved binary PSO for feature selection using gene expression data. Comput. Biol. Chem., 32(1), 29-38. doi: 10.1016/j.compbiolchem.2007.09.005

Dhillon, I. S., Mallela, S., & Kumar, R. (2003). A divisive information theoretic feature clustering algorithm for text classification. J. Mach. Learn. Res., 3, 1265-1287 .

Guyon, I., Andr, #233, & Elisseeff, (2003), An introduction to variable and feature selection. J. Mach. Learn. Res., 3, 1182-157 .

Guyon, I., Weston, J., Barnhill, S., & Vapnik, V, (2002), Gene Selection for Cancer Classification using Support Vector Machines. Mach. Learn., 46(1-3), 389-422. doi: 10.1023/a:1012487302797

Kohavi, R., & John, G. H. (1997). Wrappers for feature subset selection. Artificial Intelligence, 97(1–2), 273-324 . doi: http://dx.doi.org/10.1016/S0004-3702(97)00043-X

Torkkola, K, (2003), Feature extraction by non parametric mutual information maximization. J. Mach. Learn. Res., 3, 1415-1438 .

Seleção de recursos em problemas de larga escala usando clustering e meta-algoritmos

Palavras-chave

Como Citar

Resumo

Downloads

Referências

Informações da Revista

Diretrizes

Políticas

Contate-Nos

Seleção de recursos em problemas de larga escala usando clustering e meta-algoritmos

Palavras-chave

Como Citar

Baixar Citação

Resumo

Downloads

Referências