Google Umumkan Proyek Studi Kulturomika Sosio Linguistika Regim Digital

Tinuku
News KeSimpulan.com - Selamat datang dalam regim digital! Ketika kata slenthum menginduksi perbendaharaan kosa kata Bahasa Inggris.

Analisis teks melacak 200 tahun perubahan bahasa dan kecenderungan sosial. Google merilis proyek studi kebudayaan sebagai cara baru yang berguna bagi periset dan berawal hanya rasa penasaran untuk melacak berapa banyak kata yang ditambahkan ke bahasa Inggris setiap tahun dan kecepatan ketenaran selebritis dalam kesadaran publik sebagai "culture genome" yaitu dari Google.com!

Arsip digital web browser yang dominan tentang buku-buku dari seluruh dunia menawarkan sumber daya baru secara luas untuk meneliti perubahan kosa kata dan tata bahasa pada level di mana teknologi baru diadopsi, memori kolektif suatu peristiwa dan perubahan popularitas, hingga nama dan topik sebuah penelitian.

Sebuah tim yang dipimpin oleh Jean-Baptiste Michel, biolog, dan Erez Lieberman-Aiden, bioengineer, keduanya dari Harvard Univ, melacak frekuensi berbagai kata yang muncul pada hampir 5,2 juta buku yang telah didigitalkan dalam kurun waktu terbitan antara 1800 hingga 2000 yang lalu. Analisis sudah dilakukan sekitar 4 persen dari semua buku yang pernah diterbitkan, sekitar sepertiga dari arsip digital di database Google.

Michel, Lieberman-Aiden dan rekan-rekannya, termasuk peneliti di Google, Encyclopedia Britannica dan American Heritage Dictionary, merujuk pada analisis matematis teks dari waktu ke waktu sebagai kulturomika (culturomics).

"Skala penelitian ini 500 miliar kata yang dilacak selama dua abad akan memberi nafas. Hasil pertama menunjukkan jalan, kuantitatif ketat, linguistik historis," komentar Robert Darnton, kulturis dan sejarahwan dari Harvard Univ, yang tidak terlibat dalam proyek.

Dalam salah satu bagian dari analisis tersebut, tim kulturomika menghitung sekitar 8.500 kata-kata baru setiap tahun menginjeksi bahasa Inggris antara tahun 1950 hingga 2000. Proses tersebut memicu pertumbuhan 70 persen jumlah kata bahasa Inggris yang melonjak dari 597.000 kata menjadi 1.022.000 kata.

Sekitar setengah dari kata-kata yang digunakan dalam buku-buku berbahasa Inggris sekarang ini tidak ditemui dalam kamus standar, termasuk slenthum (nama alat musik Gamelan dari Indonesian) atau deletable.

Michel bersama tim juga mendokumentasi pergeseran arah yang diterapkan di masa lalu (dinotasikan dengan menambahkan) sampai 16 persen dari kata kerja tidak beraturan bahasa Inggris yang terkonjugasi dengan cara tidak biasa. Untuk kata speed, misalnya, past-tense speed berubah menjadi speeded mungkin oleh pergeseran makna kata dari "to move rapidly" menjadi "to exceed the speed limit." Linguistika transisi dari irregular to regular verb forms merupakan kunci penanda perubahan gramatikal.

Kata kerja light dan wake, sudah diketahui menjadi irregular pada 500 tahun yang lalu, menjadi sebagian besar regular pada tahun 1800 (lighted dan waked) dan telah kembali ke irregular past tenses (lit dan woke).

Data juga menunjukkan bukti yang jelas dari sensor sebagai nama tabu tertentu yang menghilang dari penggunaan di negara-negara tertentu seperti "Tiananmen Square" di China setelah tahun 1989. Demikian juga "Leon Trotsky" menurun tajam digunakan dalam buku-buku Rusia sekitar 1940 dan nama-nama aktor kulit hitam Hollywood lebih sedikit disebut selama histeria anti-komunis di AS.

Terlepas dari apa yang terjadi pada past tenses, masyarakat semakin melupakan masa lalu. Para peneliti menghitung frekuensi masing-masing pada tahun 1875-1975 yang muncul dalam buku-buku dari tahun lainnya sebagai ukuran yang ditarik dari tahun tertentu. Butuh waktu 32 tahun pada tahun 1880 sebagai puncak dan kemudian turun, petunjuk yang dianggap penting oleh para peneliti dibandingkan dengan rentang 10 tahun untuk referensi pada tahun 1975.

Para peneliti mengatakan masyarakat memberi temuan baru secara cepat seiring teknologi. Ketenaran seseorang dapat melesat cepat daripada abad sebelumnya bahkan menjadi lebih singkat. "Orang-orang mendapatkan popularitas dengan cepat, tetapi akan dilupakan lebih cepat dari sebelumnya," kata Lieberman-Aiden.

Analisis kuantitatif semacam ini merupakan alat baru yang penting bagi sarjana humaniora, kata Brett Bobley, direktur Office of Digital Humanities di US National Endowment for Humanities, Washington, DC. "Ada banyak potensi di sana. Kita berada di titik kritis yang nyata," kata Bobley.
  1. Jean-Baptiste Michel, Yuan Kui Shen, Aviva P. Aiden, Adrian Veres, Matthew K. Gray, The Google Books Team, Joseph P. Pickett, Dale Hoiberg, Dan Clancy, Peter Norvig, Jon Orwant, Steven Pinker, Martin A. Nowak and Erez Lieberman Aiden. Quantitative Analysis of Culture Using Millions of Digitized Books, Science, 16 December 2010, DOI:10.1126/science.1199644
Erez Lieberman Aiden http://www.erez.com/
Jean-Baptiste Michel http://www-test.iq.harvard.edu/people/jean_baptiste_michel
Tinuku Store

No comments:

Post a Comment