Skip to content

matinnuhamunada/SINTA_data_mining

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

33 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

SINTA_data_mining

Proyek iseng scraping peneliti life sciences di Indonesia dari https://sinta.ristekbrin.go.id. Kunjungi tulisan saya mengenai output proyek ini di https://matinnuhamunada.github.io.

Thanks to https://github.com/rendicahya/sinta-scraper for making this happen

Goals

Repository ini bertujuan untuk memetakan peneliti life sciences di Indonesia. Dengan memetakan bidang keahlian peneliti life sciences, diharapkan kita dapat dengan mudah mencari kolaboran di berbagai institusi di Indonesia.

Bagaimana kamu bisa berkontribusi?

Anda bisa berkontribusi dengan cara:

  • Melakukan kurasi terhadap data, baik dengan mengisi tabel identitas peneliti secara manual, atau juga memberikan informasi mengenai peneliti yang sudah pensiun / tidak aktif.
  • Memberikan rekomendasi peneliti atau institusi life sciences
  • Mengolah dan menganalisis data
  • Memberikan kritikan dan masukan :)

Repo structure

├── README.md
├── data
│   └── {Universitas}
│       ├── {Universitas}_data_NIDN.txt #[optional] manually curated data
│       ├── {Universitas}_bio_retired.txt #[optional] excluded authors
│       └── {Universitas}_affil_information.txt
├── notebooks
│   ├── 00_data_scraping-all.ipynb #scrape data and prepare for vis
│   ├── 00_data_scraping-template.ipynb #for manual exploration and scraping
│   └── 01_data_cleaning.ipynb #clean & initial visualization
├── scripts
│   └── author_search.py
├── envs
│   └── sinta.yml
├── tables
│   ├── {Universitas}_bio_clean.csv
│   └── {Universitas}_bio_ready.csv
└── figures
    └── bio_sinta.html # bokeh output

Ideas & To Dos

Thanks to this page on how to embed bokeh html here