Doğru veriler yanlış bilgi ürettiğinde

Perşembe günü bir Collibra konferansında konuşan astrofizikçi Neil deGrasse Tyson, verilerin ötesinde görünen değere bakmak önemlidir, çünkü bazen bu yanıltıcı olabilir.

data-analytics-2-metamorworks.jpg

Resim: iStockphoto/metamorworks

Bazen doğru veriler yanlış bilgi verir, bu nedenle iyi veriler yanlış sonuçlara yol açar. Hayden Planetarium'un yöneticisi ve aynı zamanda bir yazar ve TV programı sunucusu olan ünlü astrofizikçi Neil deGrasse Tyson'ın mesajı buydu.

deGrasse Tyson, Perşembe günü Collibra'nın Data Citizens '21 etkinliği sırasında bir astrofizikçinin merceğinden veriler üzerine bir konuşma sırasında yorumlarını yaptı.

DeGrasse Tyson, bilim adamlarının galaksinin yapısı hakkında düşünmemizi sağlayan teleskoplar sayesinde giderek daha fazla veri toplayabildiğini söyledi. Şimdi üretimde büyük bir sinoptik araştırma teleskopu 3,2 gigapiksele sahip olacak ve gece başına 20 terabayt veri işleyecek ve 10 yıl boyunca çalışacak dedi. Ömrünün sonunda 500 petabayt veri üretmiş olacak.

GÖRMEK: Veri gizliliğinde gezinme (ücretsiz PDF) (Teknik Cumhuriyeti)

"Her şey büyük verilerle ilgili. Verileri her zaman önemsedik" ve şimdi onu dünyanın en güçlü teleskoplarından biri olacak olanla işleme yeteneğine sahibiz, dedi. "Evren küçülmüyor ve daha güçlü teleskoplar galaksinin daha uzunu görmemizi sağlıyor."

DeGrasse Tyson, teleskopun her 20 saniyede bir 15 saniyelik pozlar alacağını ve bunun da evrenin ilk "filmini" yaratacağını söyledi. Bu süreç her üç günde bir tekrarlanacak ve bilim adamlarının evrendeki karanlık maddeyi haritalamasına yardımcı olacak.

Bununla birlikte, bilim adamları, verilerin onları ne zaman farklı şekilde yönlendirdiğini ve "yanıltıcı olan doğru veriler" ürettiğinin farkında olmalıdır. deGrasse Tyson, işlerin her zaman göründüğü gibi görünmediğine ve kare hızlarına bakıldığında verilerin nasıl yanlış yorumlanabileceğine dair birkaç örnekle konuşmasını noktaladı.

Bir keresinde, aşağı doğru yavaşça kayıyormuş gibi görünen ama aslında çok daha hızlı giden bir helikopteri betimleyen bir video gösterdi. "Eksik olan ve sizi yanıltan doğru verilere dikkat edin" diye uyardı.

Zaman her zaman göründüğü gibi değildir

Sonra yanlış olan kesin veri sorunu var. deGrasse Tyson, en sevdiği sorunun, birisinin saatin kaç olduğunu sorduğunda ve bir kişinin 2021 yılı olduğunu söylediğinde olduğunu söyledi. "'Öyle demek istemedim' diyeceksiniz. 'Doğru ama kesin değil' diyeceksiniz."

Bir kişi 12 saat, 24 dakika ve 309.74 saniye olduğunu söylerse, bu gerçekten kesin gibi görünüyor, "ama kesin olmadığını söylediğiniz anda. Bu işe yaramaz bir kesinlik" çünkü zaman çok hızlı değişiyor.

1970'lerde New York'un Times Meydanı'nda saniyenin onda biri kadar doğru olduğunu iddia eden bir saat gördüğünden bahsetti, ancak daha sonra saatin beş dakika geciktiğini öğrendi.

DeGrasse Tyson'ın dediği gibi, "kötü verileriniz olabilir ve bunun kötü veri olduğunu bilemezsiniz. Sonra sonraki tüm kararları kötü verilere dayandırırsınız."

Güneş sistemindeki bazı gezegenlerin keşfi ve Newton'un Fizik Yasası ve kötü koordinatlarla ilgili sorunlar hakkında ayrıntılara girdi.

Örnekleri "empatiye davet" olarak ve diğer olasılıklara açık kalmak için "çünkü sınırdayken bilemezsiniz… belki veriler iyidir, belki kötüdür veya belki de nasıl yorumlayacağınıza dair fikrinizdir. o kötü."

DeGrasse Tyson, bazen doğru ancak kesin olmayan verilerin fenomenleri gizleyebileceğini söyledi. Örneğin, günde 86.400 saniye vardır, dakikada 60 saniye x 60 dakika bir saatte x günde 24 saat esas alınır. Bu 1900 yılı için tanımlanmıştır.

Ama sonra gittik atom zamanı 1972'de bir günde 86.400.003 saniyelik bir ölçüm üretti. Birçoğu bunun yeterince kesin olduğunu düşünürken, bunun dünyanın dönmesi için geçen süre gibi sonuçları olabilir.

DeGrasse Tyson, dünyanın dönüşü yanlışsa, güneş tutulması yanlış yerde olur dedi. 1972'den beri, daha doğru zaman üretmek için 17 artık saniye eklendi. "Daha iyi veriler bizi oraya getirdi" dedi.

Alıntıladığı bir başka ilginç örnek, iki doğru, ancak çelişkili veri kümesi olduğu zamandı. DeGrasse Tyson, Seattle Seahawks ve Philadelphia Eagles arasındaki bir NFL oyununda, örneğin, topun geriye gittiği bir "Galile dönüşümü" atışı olduğunu söyledi. Oyun kurucu topu geriye doğru bir atışta koşarak geri attı. Ancak her iki oyuncu da çok hızlı koştuğu için Eagles bunu ileri pas olarak adlandırdı.

DeGrasse Tyson, "Teknik olarak, sahadaki referans çerçevesinde görüldüğü gibi, ancak açıkça iki oyuncu arasında geriye doğru bir pas var." Dedi. Twitter'da bunun hakkında görüş bildirdi ve iki gerçek veri parçası olduğunu söyledi – ama hepsi onu nasıl yorumladığınızla ilgili.

"Rasyonel, medeni bir dünyada aydınlanma yayı verilerle başlar, ancak bunlar sarkandır ve verilerinizi gerçeklere dönüştürmek için anlamak istersiniz. Ancak gerçekler tek başına anlayışlı değildir."

Bilgi işlenir ve bir sonraki seviye, birinin içgörü üretmek istediği bir fenomenin farkında olduğu bilgidir. "Veri işleme analizi ve anlayışının fabrika hattının sonunda, nihai ürün olarak bilgeliği istiyorsunuz" dedi.

Verilerde önyargı

Collibra'nın CMO'su Tifenn Dano Kwan, özellikle doğru olduğunda verilerin insanları nasıl yanlış yönlendirebileceğini sordu. Bu güven sorunlarına yol açar, dedi.

DeGrasse Tyson, "Bu, verilerde neyin yanlış gidebileceğinin çarkındaki tamamen başka bir dişlidir" dedi. Yüz tanıma yazılımındaki önyargı belgelenmiştir ve programcının veya verileri finanse eden kuruluşun önyargısını içerebilecek kişiler hakkında toplanan her türlü veriyle ilgili sorunlar olabilir.

DeGrasse Tyson, "geçersiz bir cevabı" olmadığını kabul ederken, insanlara verilerle denemeler yapmalarını ve kendilerine "Kullanıcının aradığı şeyi yakalıyor mu?" gibi sorular sormalarını tavsiye etti.

Veya "aramadığınız ama dikkat etmeniz gereken bir şeyi mi yakalamak?" Verileri sorgulayan ve ne anlama geldiğini soran insanlarla dolu bir oda olmalı ve ne söylemesi gerektiğini düşündüklerini ortaya koyuyor mu? Dikkate alınması gereken bir diğer soru da aynı deney tekrar yapılırsa aynı veri seti ortaya çıkacak mı?

DeGrasse Tyson, "Ona bakması için başka birini bulun," dedi. "Size benzemeyen biri. Sonra verileri sorgulayabilir, karakterize edebilir ve ilerleyebilirsiniz ve onu tamamlamak için farklı veriler elde edebilirsiniz. Sonra ileriye doğru adım atarsınız."

Ayrıca astrofizik alanında geleceğin neler getirebileceği soruldu.

DeGrasse Tyson, "Korkularımdan biri, verilerin içinde boğulacağımız ve artık hiçbir şey hakkında veri elde etmeyi haklı çıkaramayacağımız için çok fazla veri elde edeceğimiz, çünkü hala analiz edilmemiş verilerin dikkatinizi beklediğini" söyledi. "Umarım o gün gelmez."

Ayrıca bkz.

Source link

İlk yorum yapan olun

Bir yanıt bırakın

E-posta hesabınız yayımlanmayacak.


*