در جریان ماجرای رسوایی آژانس امنیت ملی امریکا و لو رفتن ابزار مخوف Boundless Informant (خبرچین بیکران) با عبارت متادیتا (Metadata) روبرو شدیم. در این مطلب می خواهیم ببینیم که منظور از آن دقیقا چیست.
ابتدا
به نکته ای اشاره کنیم. بحث فعلی پیرامون این نیست که آیا دولت امریکا در
حال شنود تلفن های افراد یا خواندن ایمیل آنها هست یا خیر. "شنود کلمات
خاص" بیشتر مربوط به پروژه
ECHELON
می شود نه PRISM. بنابراین در کل، شنود انجام می شود و ابعاد وسیعی هم
دارد. اما در اینجا می خواهیم پیرامون مورد دوم بحث کنیم، یعنی پریسم، داده
ها و اهمیت آنها. تفاوت بین شنود و داده کاوی چیست؟
تصور بر این است که در ماجرای ECHELON دولت امریکا به تجزیه و تحلیل محتوای
رد و بدل شده در ارتباطات می پردازد تا کلمات خاصی را که مربوط به دو حوزه
مواد مخدر و تروریسم است، بیابد. (البته دیروز نوشتیم که
سران سیاسی
هم هدف چنین شنودهایی هستند.)
با توجه به اینکه در بحث شنود، حجم عظیمی از داده ها باید تحلیل شود، و
متدهای رمزنگاری به طور فراگیر بین افراد فعال در دو حوزه مواد مخدر و
تروریسم (و سیاست!) استفاده می شود، این کار در کنار فواید احتمالی،
دردسرهای زیادی هم دارد. در نتیجه چه بهتر که بشود دایره جستجو را کوچکتر
کرد. اینجا ست که بحث داده کاوی به میان می آید.
خوب یا بد، این فقط محتوای ارتباطات نیست که می تواند اطلاعات معنی داری به
دستگاه های اطلاعاتی بدهد. ایده ای که در مورد PRISM مطرح شده این است که
کاری به محتوای صوتی یا متنی که می تواند رمزنگاری شده هم باشد، ندارد. (آن
کار بر عهده ECHELON است.) در عوض داده های مربوط به "خود تماس" مورد کاوش
قرار می گیرد. این چیزی است که به آن Metadata می گوییم: داده هایی درباره
داده ها.
چه نوع داده هایی می توان در رابطه با ارتباطات افراد جمع آوری کرد؟ در زیر فهرستی کوتاه از سوالات رایج را می بینید:
تماس...اینها در ظاهر اطلاعات ساده ای هستند، ولی در عین حال قدرتمند. البته انتظار ندارید که NSA اینقدر قابل پیش بینی باشد؟ پس تخیلتان را هم به کار بیندازید و به فهرست بالا اضافه کنید.
- از کجا آمده؟
- به کجا ختم شده؟
- چه زمانی شروع شده؟
- چه مدتی طول کشیده؟
- چند مرتبه تکرار شده؟