Quantcast
Channel: گارنی GARNI
Viewing all articles
Browse latest Browse all 9359

داده کلان داده ای بهتر استBig data is better data

$
0
0

داده کلان داده ای بهتر استBig data is better data

سخن رانی کنت کوکیر Kenneth Cukier

ترجمه گارگین فتائی

.

https://www.ted.com/talks/kenneth_cukier_big_data_is_better_data/transcript

.

سیب    این سیب است البته از کجا   آن را می شناسیم ؟ به علت داده ها .  شما به حراجی های سوپرمارکت ها در مورد کیک سیب سی سانتیمتری که یخ زده  نگاه کنید بیشتر حراج ها سیب هستند اما بعداً  سوپر مارکت ها شروع به فروش کیک سیب های کوچک تر یازده سانتی متری کردند و ناگهان سیب به جایگاه چهارم  یا پنجم سقوط کرد چرا ؟

چه اتفاق افتاد؟ بسیار خوب در باره اش فکر کنید وقتی شما کیک سیب سی سانتی متری می خرید تمام خانواده  باید موافقت کند و سیب  هم مورد علاقه دوم هست اما وقتی شما یک کیک سیب یازده سانتیمتری تقسیم ناپذیر می خرید  شما چیزی را می خرید که می خواهید.  شما می توانید اولین انتخاب را به دست بیاورید شما داده بیشتری دارید شما می توانید چیزی را ببیید که وقتی میزان کمی از آن را داشتید نمی توانستید  آن را ببینید.

حالا نکته اینجاست که داده های بیشتر  تنها به ما اجازه نمی دهد   بیشتر از همان چیزی که ما به آن نگاه  می کردیم ببینیم بلکه  داده بیشتر به ما اجازه می دهد که چیزهای تازه ببینیم . آن به ما اجازه می دهد که بهتر ببینیم اجازه می دهد به ما که متفاوت ببینیم در این مورد به ما اجازه می دهد  بدانیم که چه کیک سیبی مورد علاقه آمریکایی هاست نه خود سیب.

تا کنون شما احتمالاً اصطلاح « داده کلان  big data» را شنیده اید اما شما ااحتمالاً از شنیدن این اصطلاح ضعیف هستید در حقیقت  مقدار زیادی گزافه گویی در این مورد وجود دارد و این بسیار تاسف بار است زیرا داده کلان ابزار  بینهایت مهمی است که از طریق آن جامعه پیشرفت خواهد کرد . در گذشته ما به داده های کوچک  توجه می کردیم و گمان می کردیم که این به معنی تلاش برای فهمیدن دنیاست و حالا ما مقدار بیشتری از آن را داریم بیشتر از آنچه که تا کنون توانسته ایم به دست آوریم . آنچه ما متوجه می شویم این است که ما حجم بزرگی از داده ها را دریافت می کنیم اساساً می توانیم چیزهایی انجام دهیم که وقتی تنها میزان کمتری از آن را داشتیم قادر به انجام آن نبودیم . داده کلان مهم و  تازه است و وقتی شما در باره ، تنها راهی که سیاره ما در برابر چالش های  جهانی می اندیشید یعنی   تغذیه مردم ، تامین نیازهای دارویی و پزشکی آنها ، تامین نیروی برق و انرژی آنها و حصول اطمینان از اینکه آنها سوزانده نشده و به علت گرامی جهانی  مبدل به خشکی نمی شوند مواجه می شوید  به علت استفاده موثر از داده ای کلان است .

بناراین  چه چیز داده های کلان تازه است ؟ مشکل بزرگ یا چالش بزرگ چیست؟ خوب برای پاسخ دادن به این سوال اجازه دهید در مورد آن اطلاعاتی که از لحاظ فیزیکی شبیه به گذشته به نظر آمد فکر کنیم . در 1908 در جزیره کرت Creteباستان شناسان یک لوح گلی clay discکشف کردند که قدمت آن را دوهزار سال قبل از میلاد می دانند بنابراین این لوح گلی چهار هزار سال قدمت دارد . کنده کاریهایی روی این لوح  گلی وجود دارد اما ما فعلاً علت  آنها را نمی دانیم . آن یک راز کامل است اما نکته این است که آن اطلاعاتی است که شبیه چهار هزار سال قبل به نظر آمده .  این چگونگی ذخیره و اطلاعات در جامعه است .

جامعه خیلی  پیشرفت نکرده است . ما هنوز اطلاعات را در دیسک ها ذخیره می کنیم اما اکنون اطلاعات بیشتری را می توانیم بیشتر از آنچه  قبلاً بوده  ذخیره کنیم . اکنون  جستجو و کپی کردن آن آسان تر است و آنچه ما می توانیم انجام دهیم این است که می توانیم این ااطلاعات را برای کاربردهایی که هرگز حتی وقتی که اولین بار این داده ها را جمع می کردیم تصورش را هم نمی کردیم دوباره مورد استفاده قرار دهیم . در این مورد اطلاعات از یک جسم مرده به یک جسم در جریان یعنی از چیزی که غیر متحرک و ایستا است به چیزی که جاری و متحرک است رفته  یعنی اگر شما بخواهید اطلاعات را جاری کنید لوح  مکشوفهء سنگین  با قدمت چهار هزار ساله مقدار زیادی اطلاعات ذخیره نمی کند و آن اطلاعات هم تغییر ناپذیر هستند بر عکس تمام فایلهایی که ادوارد  اسنودن از آژانس امنیت ملی در ایالات متحده  گرفت . این اطلاعات در یک مموری استیک memory stickجاسازی شده که اندازه  ناخن است و آن می تواند با سرعت نور به اشتراک گذاشته شود . داده بیشتر و بیشتر

یک دلیل که چرا ما در جهان امروز داده ای بسیار زیاد داریم این است که ما در حال جمع آوری چیزهایی هستیم که همیشه در مورد آنها اطلاعات جمع آوری کرده ایم اما دلیل دیگر این است که ما در حال گرفتن چیزهایی هستیم که همیشه متضمن آگاهی بوده اند اما هرگز در داخل یک فرمت داده عرضه نشده و  ما آنها  را به داده ها اضافه می کنیم . برای مثل در مورد مساله مکان فکر کنید برای مثال مارتین لوتر اگر ما می خواستیم  بدانیم در سال 1500 مارتین لوتر کجا بود ما ناگزیر بودیم از او در همه زمانها شاید با یک قلم پر feathery quillو یک جوهردان  پیروی کرده و آن را ثبت کنیم اما  حالا در مورد آنچه که امروزه شبیه آن است فکر کنید شما هر جایی را احتمالاً از طریق  حمل کننده های  داه های ارتباطات از  راه دور می شناسید .  یک برگ گستر spreadsheetو یک پایگاه داده ها databaseوجود دارد که تماماً اطلاعات شما را از جایی که در همه زمانها بوده اید ثبت می کند اگر شما تلفن همراه دارید و تلفن همراه شما جی پی اس  دارد و یا حتی اگر جی پی اس هم ندارد تمام اطلاعت محلی  که بوده اید را ثبت کند .

حالا شما در مورد یک حالت فکر کنید مثلا طریقه ای که الان نشسته اید . طریقه ای که شما می نشینید کاملاً متفاوت است آن وظیفه ساق پا و طول ان و پشت و کمر و ناحیه ای  از پشت شما و اگر قرار بود من سنسور یا حسگر بگزارم شاید صد حسگر داخل هر کدام از صندلیها می گذاشتم و  می توانستم برای شما ضمیمه ای منحصر به فرد از  چیزی مثل اثر انتگشت ایجاد کنم  اما آن نگشت شما نیست .

بنابراین ما در این مورد چکار می توانیم بکنیم ؟ محققین در توکیو در حال به کار گیری آن به عنوان وسیله ضد سرقت در ماشین ها هستند.  ایده ای که بر اساس آن اتومبیل ربا پشت چرخ می نشیند و سعی می کند آن را خاموش کند اما اتومبیل تشخیص می دهد که راننده تایید نشده پشت چرخ است و ممکن است موتورالساعه بیاستد  مگر اینکه شما پسوردی  داخل داژبورت تایپ کنید تا بگوید "هی من اجازه راندن این ماشین را دارم " چه عالی !

اگر هر ماشین تک سرنشینی در اروپا این تکنولوژی را داشت چه میشد ؟ شاید اگر ما داده ها را جمع می کردیم از علایمی آگاه می شدیم که بهترین پیش بینی را  در مورد اینکه مثلاً  در پنج ثانیه بعد یک تصادف به وقوع  خواهد پیوست می کرد بنابراین آنچه که ما داده بندی خواهیم کرد خستگی راننده و نظایر آن خواهد بود وقتی که ماشین  حالتی را که شخص در آن فرو افتاده احساس کند و به طور اتوماتیک می شناسد هی یک آلارم داخلی که چرخ ماشین را بلرزاند قرار بده  تا به سمت داخل بوق زده و بگوید "هی بیدار  شو توجه بیشتری به جاده بکن"اینها انواع چیزهایی هستند که ما وقتی جنبه های بیشتری از زندگیمان را داده پردازی می کنیم می توانیم انجام دهیم .

بنابراین ارزش داده کلان چیست؟ خوب در باره آن فکر کنید شما اطلاعات بیشتری دارید ما می توانید چیزهایی را انجام دهیم که قبلاً نمی توانستیم یکی از موثرترین حوزه هایی که این مفاهیم در آن واقع می شوند در حیطه یادگیری ماشینی Machine learning  است یادگیری ماشینی شاخه ای از هوش مصنوعی است که خود شاخه ای از دانش کامپیوتر است . ایده کلی این است که به جای اینکه به جای آموزش کامپیوتر که چه باید کرد ما به سادگی مشکل را به گردن داده می اندازیم  و می گوییم به کامپیوتر که خودش آن را حل کند و به شما کمک خواهد کرد که بوسیبله دیدن اصولش آن را  درک کنید . در 1950 یک دانشمند علوم کامپیوتر در آی بی ام به نام آرتور ساموئل که دوست داشت چکرز checkersبازی کند  یک برنامه کامپیوتری نوشت طوری که بتواند با کامپیوتر بازی کند او بازی کرد و برد بازی کرد و برد بازی کرد و برد زیرا کامپیئوتر تنها حرکات قانونی را می شناخت و اما ساموئل چیزهای دیگری هم می شناخت .او استراتژی را می شناخت بنابراین او به موازات آن یک زیربرنامه subprogramنوشت که در پیش زمینه عمل کرده و همه کاری که انجام میداد این بود که امتیاز می داد به احتمال اینکه ترتیب ارایه شده   احتمالاً  می تواند منجر به باخت بعد از هر حرکت شود او با کامپیوتر بازی می کند و می برد بازی می کند و می برد بازی می کند و می برد سپس   میگزارد کامپیوتر با خودش بازی کند

کامپیوتر با خودش بازی می کند کالمپیوتر داده بیشتری زرا جمع می کند و دقت پیش بینی را افزایش می دهد سپس به سمت  کامپیوتر برگشته و بازی می کند بازی می کند و می بازد بازی می کند و می بازد بازی می کند و می بازد . او ماشینی ایجاد کرده است که از قابلیت وظیفه ای که به آن یاد داده جلو زده است و این ایده یادگیری ماشینی  همه گیر می شود .  شما در باره اتئمبیل های   خود ران   self-driving carsچه فکر می کنید ؟ آیا کار بهتری است که ما همه  مقررات جاده ای را داخل نرم افزار قرار دهیم ؟ نه مموری ارزانتر است نه آلگوریتم ها تندتر هستند نه پردازشگرها بهتر هستند همه این چیزها هست اما علتش نیست آن به این علت است که ما ماهیت مساله را تغییر دادیم  . ماهیت مساله را از اینکه سعی کردیم آشکارا و صریحاً توضیح دهیم به  کامپوتر که برای کسی که ما می گوییم چگونه رانندگی کند . اینجا مقدار زیادی داده  حول وسیله نقلیه هست شما کشف می کنید کشف می کنید که یک چراغ راهنمایی هست که چراغ راهنمایی قرمز است و سبز نیست که به معنی این است که شما نیاز به توقف دارید و نباید پیش بروید .  یاد گیری ماشینی بر اساس چیزهایی است که ما به صورت آنلاین انجام میدهیم . موتورهای جستجو ، آلگوریتم های تعیین هویت آمازون ، ترجمه کامپیوتری ، سیستم های تشخیص صدا . اخیراً محققین به مساله تکه پردازی biopsiesتکه پردازی های سرطانی cancerous biopsiesتوجه کرده و از کامپیوتر خواسته اند که از طریق نگاه به داده میزان بقا و طول عمر بیمار را تشخیص داده و تعیین کند که ایا سلولها به طور بالفعل سرطانی هستند یا نه و به اندازه کافی اطمینان حاصل کند . وقتی شما داده را از طریق یک آلگوریتم ماشینی در آن می گزارید  ماشین قادر بود دوازده علامت گویا را تشخیص دهد که بهترین پیش بینی این بود که مثلاً  بافت های  سلولهای سرطانی سینه در حقیقت سرطان زا هستند . مشکل این است که ادبیات پزشکی   The medical literature تنها نه تا ز آنها را می شناخت  سه تا از نشان ها آنهایی بودند که مردم نیاز به جستجوی آنها نداشتند بلکه ماشین جای آنها این کار را می کرد .

جنبه های تاریکی هم برای داده های کلان وجود دارد .آن زندگیمان را توسعه خواهد داد اما مشکلاتی هستند که ما احتیاچ داریم که از آنها آگاه شویم و اولین این موارد  این است که ممکن است ما به خاطر این پیش بینی ها مورد مجازات قرار بگیریم پلیس ممکن است از  این داده های کلان علیه اهداف و مقاصدمان استفاده کند. چیزی شبیه  فیلم گزارش اقلیت Minority Reportکه اکنون  به آن پلیس پیشگو predictive policingو یا جرم شناسی آلگوریتمی algorithmic criminologyمی گویند  و به این معنی است که اگر ما مقدار زیادی داده ارائه دهیم برای مثال در گذشته جرابم کجا واقع شده اند ما جای فرستادن گشت پلیس  را هم می شناسیم این منطقی است اما مشکل البته این است که  به سادگی بر داده محلی متوقف نخواهد شد  بلکه  به جنبه های دیگری  از فرد نیز فرود خواهد آمد.  چرا ما از داده ها برای دست نوئشته های شخصی دبیرستانها استفاده نمی کنیم ؟ شاید ما باید استفاده کنیم تا بدانیم  آنها بیکار هستند یا نه،  امتیاز کارت اعتباریشان ، رفتار لا ابالی گریشان ، اینکه ایا آنها شب تا دیروقت بیدار می مانند.  وقتی آن قاادر است فرایند های زیست شیمیایی  biochemistries  را تشخیص دهد تبعاً می تواند  نشان خواهد داد که آنها افکار تهاجمی دارند یا خیر .  ما ممکن است آلگوریتم هایی داشته باشیم که احتمالاً آنچه را که ما قرار است انجام دهیم را پیش بینی کند و ما ممکن است قبل از اینکه بالفعل عمل کنیم مسئول و پاسخگو شناخته شویم . حریم خضوضی چالشی مرکزی در یک داده کوچک بود.  در داده های بزرگ این چالش در پاسداشت آزادی اراده ، اختیار اخلاقی ، اراده انسانی و عامل انسانی خواهد بود .

مشکل دیگری وجود دارد .داده بزرگ مشاغل ما را خواهد ربود . داده بزرگ و آلگوریتم ها چالش اطلاعات حرفه ای کاری  یقه سفیدها در قرن بیست و یکم  خواهند بود به همان صورتی  که اتوماتیزه کردن کارخانه ها و خطوط مونتاژ چالش کارگران یقه ابی در قرن بیستم بود . فکر کنید در مورد تکنسین آزمایشگاهی که از طریق یک میکروسکوپ به یک بافت سرطانی نگاه می کند و تعیین می کند که آیا آن سرطان زا هست یا نه . این شخص به دانشگاه رفته.،   این شخص اموال می خرد ، رای می دهد شخص نگهددار پول در جامعه است و شغل آن شخص  نیز  از اساس تغییر پیدا خواهد کرد و  بالکل حذف خواهد شد.  حالا ما دوست داریم فکر کنیم که تکنولوژی مدت زمانی بعد از یک دوره کوتاه و موقتی جا به جایی ایجاد خواهد کرد و این واقعاً چارچوبی است که ما در آن زندگی می کنیم-  انقلاب صنعتی  - زیرا آن دقیقا آن چیزی است که اتفاق افتاد اما ما چیزی را در آن تجزیه وتحلیل فراموش کردیم تعدادی طبقه بندی از مشاغل وجود دارند که  این حذف شدن  را تسهیل نموده و هرگز بر نمی گردند .  انقلاب صنعتی خیلی خوب نبود اگر شما یک اسب بودید بنابراین ما نیاز داریم که محتاط باشیم و داده های کلان را برای نیازهایمان ،  نیازهای بسیار انسانیمان تعدیل کنیم . ما ناگزیریم رئیس این تکنولوژی باشیم نه خدمتگزار آن . ما همه درابتدای این داده های کلان هستیم . صادقانه باید گفت که ما  در استعمال همه این داده ها که بتواتیم جمع آوری کنیم خیلی خوب نیستیم.  آن فقط برای آزانس امنیت داخلی یک مشکل نیست ، مشاغل و کسب و کارها مقدار زیادی داده جمع آوری می کنند و از آن سوء استفاده نیز می کنند و ما نیاز داریم در این مورد بهتر شویم و این زمان خواهد برد مثل چالشی خواهد بود که اولیه با کشف آتش  با آن مواجه شد این هم یک ابزار است منتهی  باید مواظب باشیم که خود ما را نسوزاند.

 داده های کلان چگونگی زندگیمان را ، کارمان را و فکرمان را  دگرگون خواهند ساخت . آن به ما کمک خموهد کرد که مشاغل خود را مدیریت کرده و  زندگی های خود را به سمت رضایت مندی ، امید ، شادمانی و سلامت رهبری کنیم اما در گذشته ما اغلب به اطلاعات تکنولوژی توجه کردیم و چشمهایمان تنها ت تکنولوؤژی  را دیده،،  تکنولوژی سخت افزار زیرا آنچه که فیزیکی و جسمانی بود  . ما احتیاج داریم که چشم خیرهء مان را به سمت آالف اطلاعات نیز که کمتر پدیدار اما از برخی جهات بسیار مهم تر است از نو قالب ریزی کنیم . سرانجام انسانیت می تواند  از اطلاعاتی که جمع آوری کرده  به عنوان بخشی از جستجوی بی پایان درک دنیا و مکانی که در آن هستیم و اینکه چرا داده های کلان یک مساله  بزرگ است استفاده کند

 


Viewing all articles
Browse latest Browse all 9359

Trending Articles



<script src="https://jsc.adskeeper.com/r/s/rssing.com.1596347.js" async> </script>