Genetic Algorithm on K-Means Clustering

This Project is mainly based on the Genetic-Kmeans-Algorithm-GKA-

The approaches which I used

Min-max normalization for standardization
Davies–Bouldin index for evaluation of each cluster
IN GENETIC :
- Rank-based selection
- One-point crossover

Requirements

Panda
NumPy

Getting Started

python __main__.py

Input

The data that I analyzed is from Iris
- data/iris.csv have 3 column and data/iris2.csv have 4 column and data/isis_with_header.csv with header
config.txt contain control parameters
- kmax: maximum number of clusters
- budget: budget of how many times run GA
- numOInd: number of Individual
- Ps: the probability of ranking Selection
- Pc: the probability of crossover
- Pm: the probability of mutation

Output

norm_data.csv is normalization data
cluster_json is centroid of each cluster
result.csv is data with labeled to each cluster

Analysis

the accuracy of GA on K-means: 88%
the accuracy of k-means++: 83%

Reference

Genetic-Kmeans-Algorithm-GKA-

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
data		data
result		result
.gitignore		.gitignore
__main__.py		__main__.py
chromosome.py		chromosome.py
cluster.py		cluster.py
config.txt		config.txt
generation.py		generation.py
genetic.py		genetic.py
kmeans-test.py		kmeans-test.py
readme.md		readme.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Genetic Algorithm on K-Means Clustering

The approaches which I used

Requirements

Getting Started

Input

Output

Analysis

Reference

About

Releases

Packages

Languages

amirdeljouyi/Genetic-Algorithm-on-K-Means-Clustering

Folders and files

Latest commit

History

Repository files navigation

Genetic Algorithm on K-Means Clustering

The approaches which I used

Requirements

Getting Started

Input

Output

Analysis

Reference

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages