Seleção de recursos em problemas de larga escala usando clustering e meta-algoritmos

Autores

  • Fardin Akhlaghian Tab Faculty of Communication and Modern Languages Universiti Putra Malaysia (UPM)
  • Shabnam Amiri Faculty of Communication and Modern Languages Universiti Putra Malaysia (UPM)

Palavras-chave:

Selección de funciones, clustering y meta-algoritmos.

Resumo

A seleção de recursos de entrada apropriados no aumento da eficiência dos algoritmos de mineração de dados tem um efeito direto e significativo. Mais precisamente, essa extração de conhecimento dos dados de problemas é facilitada por três coisas: redução de volumes de dados, eliminação de recursos duplicados e eliminação de recursos não relacionados. Dada essa necessidade, uma extensa pesquisa foi realizada nos últimos anos com uma variedade de tendências (estatística, algorítmica e aprendizagem) a esse respeito. Nesse meio tempo, hiper-algoritmos como algoritmos genéticos têm sido considerados por muitos pesquisadores. Nesta pesquisa, tentamos obter mais eficiência combinando algoritmos de agrupamento e genéticos e reduzindo o tempo computacional.
A este respeito, uma nova representação do algoritmo genético correspondente a este problema é apresentada e seus operadores são apropriadamente definidos. Além disso, para o uso eficiente de clustering neste estudo, foi necessário fornecer um algoritmo relativamente novo para clustering rápido. Para validar os métodos propostos e determinar sua eficiência na solução de problemas reais, vários experimentos foram realizados em dados padrão. Na próxima etapa, analisando os métodos propostos, comparamos os resultados dos experimentos com vários algoritmos reportados em artigos novos e válidos. Essas comparações mostraram melhorias na eficiência dos métodos propostos em termos de precisão de categorização e redução de recursos em comparação com os métodos concorrentes. De acordo com a análise, essa melhoria deveu-se ao efeito positivo do agrupamento em uma busca mais rápida do espaço do problema pelo algoritmo genético e exibição adaptada.

Downloads

Não há dados estatísticos.

Biografia do Autor

Fardin Akhlaghian Tab, Faculty of Communication and Modern Languages Universiti Putra Malaysia (UPM)

English Language Department, Faculty of Communication and Modern Languages
Universiti Putra Malaysia (UPM)

Shabnam Amiri, Faculty of Communication and Modern Languages Universiti Putra Malaysia (UPM)

English Language Department, Faculty of Communication and Modern Languages
Universiti Putra Malaysia (UPM)

Referências

Alexandridis, A., Patrinos, P., Sarimveis, H., & Tsekouras, G, (2005), A two-stage evolutionary algorithm for variable selection in the development of RBF neural network models. Chemometrics and Intelligent Laboratory Systems, 75(2), 149-162. doi: http://dx.doi.org/10.1016/j.chemolab.2004.06.004

Bekkerman, R., El-Yaniv, R., Tishby, N., & Winter, Y. (2003). Distributional word clusters vs. words for text categorization. J. Mach. Learn. Res., 3, 1183-1208 .

Blum, A. L., & Langley, P, (1997), Selection of relevant features and examples in machine learning. Artif. Intell., 97(1-2), 245-271. doi: 10.1016/s0004-3702(97)00063-5

Chuang, L.-Y., Chang, H.-W., Tu, C.-J., & Yang, C.-H, (2008), Improved binary PSO for feature selection using gene expression data. Comput. Biol. Chem., 32(1), 29-38. doi: 10.1016/j.compbiolchem.2007.09.005

Dhillon, I. S., Mallela, S., & Kumar, R. (2003). A divisive information theoretic feature clustering algorithm for text classification. J. Mach. Learn. Res., 3, 1265-1287 .

Guyon, I., Andr, #233, & Elisseeff, (2003), An introduction to variable and feature selection. J. Mach. Learn. Res., 3, 1182-157 .

Guyon, I., Weston, J., Barnhill, S., & Vapnik, V, (2002), Gene Selection for Cancer Classification using Support Vector Machines. Mach. Learn., 46(1-3), 389-422. doi: 10.1023/a:1012487302797

Kohavi, R., & John, G. H. (1997). Wrappers for feature subset selection. Artificial Intelligence, 97(1–2), 273-324 . doi: http://dx.doi.org/10.1016/S0004-3702(97)00043-X

Torkkola, K, (2003), Feature extraction by non parametric mutual information maximization. J. Mach. Learn. Res., 3, 1415-1438 .

Downloads

Publicado

2018-04-30

Como Citar

Tab, F. A., & Amiri, S. (2018). Seleção de recursos em problemas de larga escala usando clustering e meta-algoritmos. Amazonia Investiga, 7(13), 17–30. Recuperado de https://amazoniainvestiga.info/index.php/amazonia/article/view/490

Edição

Seção

Articles