Summer School 2015: Web Science and Big Data Analytics

Bertempat di Fakultas Ilmu Komputer, Universitas Indonesia, pada tanggal 21 Agustus 2015 Summer School 2015 yang bertema Web Science and Big Data Analytics secara resmi dimulai. KMKLabs yang diwakili oleh Hafiz Badrie Lubis dan Parlinggoman Hasibuan ikut sebagai peserta di event yang diselenggarakan oleh Universitas Indonesia, British Council, dan University of Southampton ini.

Pada event ini, peserta ditunjukkan bagaimana data publik yang tidak terstruktur dapat digunakan untuk kepentingan yang cukup banyak, salah satu contoh kasus yang dipakai adalah untuk kebutuhan e-government. Banyak teori dan konsep yang diajarkan kepada para peserta terkait pemanfaatan data publik untuk kebutuhan tertentu. Dari tim peneliti University of Southampton, mereka menjelaskan penelitiannya mengenai web science. Dengan konsep ini mereka menunjukkan studi mengenai hubungan yang erat antara data yang tersedia di web dengan manusia. Berdasarkan penjelasan mereka, web science bukanlah bidang keilmuan computer science saja, akan tetapi irisan dari bidang-bidang keilmuan lainnya.

Tim pengajar dan peneliti dari Universitas Indonesia juga mengajarkan para peserta mengenai metode-metode dalam melakukan text analysis terhadap data publik. Pada kesempatan event kali ini, mereka bisa menunjukkan bagaimana melakukan text normalisation, stop word removal, stemming, dan sentiment analysis dari corpus yang telah mereka kumpulkan dari tweet yang bermunculan saat debat calon presiden pertama kali di tahun 2014. Para peserta ditunjukkan dan sekaligus diajarkan sehingga pada akhirnya kami bisa tahu sentiment terhadap masing-masing calon presiden saat itu.

Kegiatan pada summer school ini tidak hanya pada seminar dan workshop saja, tapi peserta dipisahkan menjadi beberapa grup, kemudian masing-masing grup diberikan tugas yang pada akhir summer school dipresentasikan kepada tim juri. Tugas-tugas yang diberikan sangat berhubungan erat dengan pemanfaatan data publik yang tersedia di web observatory UI dan web observatory UK yang telah disiapkan oleh pihak University of Southampton dan Universitas Indonesia.

Selain group project, kegiatan lainnya yang juga menjadi bagian dari summer school ini adalah konferensi yang diadakan di Hotel Pullman Jakarta Thamrin. Konferensi yang berjudul Web Science and Big Data Analytics Conference on Information Transparency and Digital Democracy menghadirkan beberapa peneliti dari University of Southampton, University of Oxford, dan National University of Singapore. Selain itu juga menghadirkan pembicara dari staff kepresidenan, pemerintah kota DKI Jakarta, dan NGO di bidang politik. Pada konferensi ini, ditunjukkan bagaimana hubungan antara bidang penelitian web science dan hubungannya dengan pemerintah. Para hadirin ditunjukkan beberapa contoh dampak positif yang ditimbulkan dengan pemanfaatan data publik untuk layanan yang lebih baik lagi dari pemerintah.

Event menarik seperti ini harus diperbanyak, tujuannya agar mengedukasi masyarakat dan juga praktisi di bidangnya bahwa banyak data digital yang dapat digunakan, diolah, dan disajikan menjadi informasi yang menarik dan bermanfaat. Karena melalui event seperti ini, peserta tidak hanya diajarkan teorinya saja, akan tetapi hingga teknis pengaplikasian teori yang diajarkan.

Summer School 2015: Web Science and Big Data Analytics

3 pemikiran pada “Summer School 2015: Web Science and Big Data Analytics

  1. Menarik, karena gw baru saja selesai main-main dalam hal ini — Sentiment Analytics with TermDocumentMatrix with WordCloud. 🙂

    Salam hangat buat temen2 di KMK bro!

    #=== [start] Playing around with R =====

    #load libraries
    library(tm)
    library(wordcloud)

    #clean up variables
    rm(list=ls())

    #setwd() if necessary

    #parse csv file
    mydata = read.csv(“somestuff.csv”, header = T, sep = “;”)

    #create own stopwords
    mystopwords = c(“yang”, “dan”, “di”, “dengan”, “untuk”)

    # VectorSource specifies that the source is character vectors.
    mycorpuswords <- Corpus(VectorSource(mydata$somecolumn))

    #a bit cleanup & put the stopwords
    mycorpuswords <- tm_map(mycorpuswords, tolower)
    mycorpuswords <- tm_map(mycorpuswords, removePunctuation)
    mycorpuswords <- tm_map(mycorpuswords, removeNumbers)
    mycorpuswords <- tm_map(mycorpuswords, removeWords, mystopwords)
    mycorpuswords <- tm_map(mycorpuswords, PlainTextDocument)

    #stemming words. Important for Indonesian words since majority contains prefixes and postfixes

    #create document-term matrix
    myDtm <- TermDocumentMatrix(mycorpuswords, control = list(minWordLength = 1))

    #inspect(myDtm)

    #wordcloud
    m <- as.matrix(myDtm)
    # calculate the frequency of words
    v <- sort(rowSums(m), decreasing=TRUE)
    myNames <- names(v)
    d <- data.frame(word=myNames, freq=v)
    wordcloud(d$word, d$freq, min.freq=100, random.color = TRUE)

    #=== [end] Playing around with R =====

    Suka

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s