فراز تیرے جنوں کا خیال ہے ورنہ عدنان مسعود کی سخن آرایاں۔ دروغ برگردن قاری

February 4, 2013

ہاں تو میاں، تمہارا پی ایچ ڈی کیسا چل رہا ہے؟

Filed under: تحقیق — ابو عزام @ 6:27 pm

اکثربے تکلف احباب دل دکھانے کو گاہے بگاہے یہ سوال کیا کرتے ہیں کہ بھئی تمہارا پی.ایچ.ڈی کب مکمل ہو رہا ہے یا تمہاری تحقیق کا کیا حال ہےیا تمہارا مقالہ تو ختم ہو کر ہی نہیں دے رہا وغیرہ وغیرہ. اس ضمن میں جامعہ اسٹینفورڈ کے فارغ التحصیل،  پی ایچ ڈی کامکس کے خالق ہورہے چام کا کہنا ہے کہ گریجویٹ اسکول کا پہلا اصول یہ ہے کہ گریجویٹ اسکول کے طالبعلم سے ازراہ ہمدردی مندرجہ بالا سوالات نا کئے جائیں، شکریہ۔

phd0227

یہ تو خیر جملہ معترضہ ٹھرا۔ یہاں کوشش یہ ہے کہ عام فہم انداز میں یہ بتانے کی کوشش کی جاۓ کہ راقم کے مقالے کا موضوع کیا ہے. مجھے علم ہے کہ اس کوشش میں نا تو میں عام فہمی سے انصاف کر پاوں گا اور نا تکنیکیت سے، اور دونوں طرف سے بری بھلی سننے کو ملیں گی، لیکن  کیا خوب کہا مرزا نوشہ نے کہ اپنے جی میں ہم نے ٹھانی اور ہے۔

 اس سے قبل تھوڑا سا پی.ایچ.ڈی کی پوسٹ گریجویٹ اکیڈمک ڈگری کا تعارف ہو جاۓ. “پی.ایچ.ڈی” یا “ڈاکٹر آف فلاسفی” ایک اکیڈمک یا تعلیمی ڈگری ہے جو درحقیقت کسی موضوع پر کی جانے والی اس اصل تحقیق کے نتیجے میں ملنے والی تحقیقی منزلت یا اجازہ کا نام ہے ۔ اس ڈگری کا منتہا ایک مقالہ و ‘ڈاکٹر؛ کا سابقہ ہوا کرتا ہے لیکن اصل محصول تحقیق کی عادت ۔ ڈاکٹر عنیقہ ناز مرحومہ  نے اسی موضوع پر راقم کی ایک تحریر پر تبصرہ کرتے ہوئے کہا تھا  کہ

پی ایچ ڈی اسپیشلائزین نہیں…، بہت سے لوگ اسی غلط فہمی میں ہیں۔ یہ دراص ایک طرح کی تربیت ہے دماغ کو آزاد روی سے سوچنے کی طرف لے جانے کی۔ اس لئے اسکی تحقیق کے عنوان سے لیکر نتائج کو جمع کرنا اور پھر انکا دفاع کرنا پی ایچ ڈی کرنے والے کی ذمہ داری ہوتا ہے۔ جبکہ ماسٹرز کی ڈگری تک یہ ٹریننگ نہیں ہوتی۔

پی ایچ ڈی کا مطلب ویژن یا بصیرت پیدا کرنا ہوتا ہے۔ اپنے راستے خود متعین کرنا،امشاہدات سے اپنے ذاتی نتائج نکالنے کی اہلیت رکھنا، اس وقت جب تمام لوگ سمجھتے ہیں کہ رات نجانے کتنی لمبی ہے اس چیز کی اہلیت رکھنا کہ صبح کے آنے کے آثار ہیں یا نہیں

عمومی طور پر پی ایچ ڈی کے دو حصّے ہوا کرتے ہیں ایک “کورس ورک ” کہلاتا ہے جس میں محقق، تحقیقی کورسز کو مکمل کرتے ہیں۔ اس کو اکثر ممالک میں ایم فل یا ماسٹر آف فلاسفی کے نام سے بھی جانا جاتا ہے۔ دوسرا حصّہ مقالے کا ہوتا ہے.ہماری جامعہ کے ڈین ڈاکٹر ایکرمین نے اورینٹیشن کے دوران طلبا کو ڈرانے کے لئے خصوصی طور پر بتایا کہ شماریاتی طور پر پچاس فیصد طلبا جو پی.ایچ.ڈی کے پروگرام میں داخلہ لیتے ہیں. اے.بی.ڈی ہو کر پروگرام کو چھوڑ دیتے ہیں. اے.بی.ڈی کا مطلب ہوتا ہے “آل بٹ ڈسرٹیشن” یعنی اگر آپکا کورس ورک مکمل ہو جاۓ لیکن مقالہ مکمل نہ ہو تو آپکو اے.بی.ڈی یا ریسرچ ڈاکٹریٹ کہا جاتا ہے.امریکا میں “پی.ایچ.ڈی” کا عمومی وقت پانچ سے سات سال کا ہوتا ہے اسی طرح سے دوسرے یورپی  ممالک مثلآ برطانیہ میں پی ایچ ڈی کچھ کم عرصے کے دوران مکمل کیا جا سکتا ہے ۔

phd022509s

راقم کی تحقیق کمپیوٹر سائنس کی ذیلی شاخ آرٹیفیشل انٹیلیجنس یا مصنوعی ذہانت کی دو ذیلی شاخوں مشین لرننگ اور ڈیٹا مائننگ سے تعلق رکھتی ہے۔ راقم اپنی تحقیق کو ایک جملے میں آسانی کے لئے،عام فہم غیر تکنیکی الفاظ میں بیان کرے تو کچھ  اسطرح کہا جا سکتا ہے کہ

 ڈیٹا کے کسی مجموعہ میں عمومی طور پر نہ پائی جانے والی اشیاء کی احتمالی دلچسپی کا شماریاتی پیمانہ

یہ تحقیق دراصل تین مختلف مطالعوں کے علاقہ جات کا مجموعہ ہے.

اولا – احتمالی گرافیکل نمونہ جات

 ثانیا – امکانیاتی پیمانہ ہاۓ شماریاتی دلچسپی 

اور ثالثا – دور افتادہ عوامل کی تلاش اور توجیح

ان تین مطالعوں کےعلاقوں کے تحقیقی ادغام و اشتراک سے راقم کی کوشش ہے کہ ایک ایسا الگورتھم یا طریقہ کار معرض وجود میں آسکے جو شماریاتی اصولوں کی بناء پر پیمانہ ہاے دلچسپی کو ڈھونڈھنے میں ہماری مدد کرتا ہو ۔

Scalable-pattern-mining-with-Bayesian-networks-as-background-knowledge-Fast-discovery-of-interesting-patterns-based-on-Bayesian-network-background-knowledge

پی.ایچ.ڈی کے مقالہ کا بنیادی مقصد علمی معرفت کی ہئیت میں تبدیلی لانا ہوتا ہے. کسی بھی علمی میدان میں، معرفت علم میں تغیر و تبدل ہی  پی.ایچ.ڈی کی تحقیق کا اصل مقصد ہوتا ہے۔ اگر ڈاکٹریٹ کی تحقیق کے دوران کسی مسئلے کا حل تلاش کیا جا رہا ہے تو اس بات کا قوئ امکان ہے کہ یہ مسئلہ اس سے پہلے کسی ریسرچر، کسی محقق، یا کسی عالم کے زیر مطالعہ رہا ہوگا. یا اس نے اپنے مقالہ میں یا تحقیقی کام میں اس کا ذکر ایک مسئلے کے طور پر یا مستقبل میں کئے جانے والے کام کے طور پر کیا ہوگا.

تحقیقی ادب کے مطالعے سے ہمیں جا بجا یہ پتا چلتا ہے کہ اے پرائوری یا استدلالی قوانین کی زیادتی ڈیٹا مائننگ  کی دنیا میں ایک بڑا مسئلہ ہے. ایک آسان مثال سمجھنے کے لیے یہ دی جا سکتی ہے کہ اگر آپ کسی مارکیٹ کے خرید و فروخت کے مجموعے کو دیکھیں تو اس میں ڈبل روٹی، انڈے اور دودھ کی ایک ساتھ فروخت زیادہ نظر آئیگی. ان استدلالی قوانین کی حمایت اور اعتماد بھی اس مجموعے میں زیادہ ہوگا. اس حمایت اور اعتماد کو شماریاتی احتمالی دلچسپی کے پیمانوں میں سے ایک قرار دیا جا سکتا ہے اسی طرح سے شماریاتی امکانی دلچسپی کے پیمانے لٹریچر یا تحقیقی ادب میں اور بھی بہت سے پاۓ جاتے ہیں. مثلآ اٹھاؤ یا لفٹ، پئرسن کورلیشن، آڈ ریشو، لیپلاس تصیح  وغیرہ

interestingness measures

ان پیمانوں کا مجموعی اطلاق کر کے ہم اس بات کا بخوبی اندازہ لگا سکتے ہیں کہ اشیاء کا باہمی تعلق کتنا گہرا ہے.مثلآ ان استدلالی اصولوں کی بناء پر یہ مفروضہ بڑی آسانی سے قائم کیا جا سکتا ہے کہ اگر کسی شخص نے بانگ درا اور ضرب کلیم خریدی ہو تو اسے بال جبرئیل بھی یقینآ پسند آئیگی اس تعلق کو بہترین طریقے سے بیان کرنے کا کام گراف کی مدد سے بناۓ گئے احتمالی نمونوں سے کیا جا سکتا ہے. مثلآ اگر اسی بات کو شماریاتی احتمالی طور پر بیان کرنا ہو کہ بارش یا فواروں کا گھاس کے گیلا ہونے پر کیا اثر ہوتا ہے تو اسے اس مندرجہ ذیل سادہ گراف کی مدد سے با آسانی بیان کیا جا سکتا ہے.

bayesianGraph

اس احتمالی نمونے کو بائزین یقین کا اتصالی نمونہ یا بائزین بیلیف نیٹورک کہا جاتا ہے. عام استدلالی نمونہ جات کی بہ نسبت بائزین بلیف نیٹ ورک میں سلف اور خلف دونوں طرح کے استدلال کرنے کی سہولت حاصل ہوتی ہے. مثلآ مندرجہ بالا مثال سے ہم دیکھہ سکتے ہیں کہ گھاس کے گیلا ہونے سے بارش کے وقوع اور اس کا ماخوذ دونوں کس قدر آسانی کے ساتھہ معلوم کیے جا سکتے ہیں.

bayesTheorem

بائزین بلیف نیٹ ورک احتمالی گراف نمونوں کی ایک قسم ہے اسکی مدد سے آپ کسی ماہر فن کی راۓ کو ایک گراف کے نمونے میں محفوظ کر سکتے ہیں. تمام امکانات کو “سی.پی.ٹی” یعنی مشروط امکانات کے جدول میں بھی محفوظ کیا جا سکتا ہے. سب سے اہم بات یہ ہے کہ اس اتصالی نمونے  میں چونکہ مختلف گروہوں کے باہمی تعلقات کو امکانات کی مد میں ظاہر کیا جاتا ہے اس لیے اس پر اشیاء کی دلچسپی کے احتمالی پیمانہ جات یا انٹرسٹنگنس میشرز کا آسانی سے اطلاق ہو سکتا ہے جیسا کہ قطری جامعہ کے رانا ملہاس اور ظاہر الغبری کے کام سے دیکھا جا سکتا ہے.

Bayes Theorem.088

اس مختصر اور کسی قدر تکنیکی تمہید کے بعد اب آپ کو یہ سمجھنے میں آسانی ہوگی کہ راقم کی تحقیق اس موضوع پر ہے کہ کس طرح سے کسی ڈیٹا سیٹ میں کم تعداد میں پاۓ جانے والی اشیاء کی دلچسپی اور افادیت کی درجہ بندی بائزئن اتصالی نمونے کے ذریعے کی جاۓ نیز وہ کونسے ایسے شماریاتی، امکاناتی پیمانے ہیں جو کم پاۓ جانے والے عناصر کی موجودگی کے لئے زیادہ حساسیت رکھتے ہیں. راقم کا الگارتھم اور طریقہ کار، ٹریننگ ڈیٹا پر بائزین بلیف نیٹ ورک کو استعمال کرتے ہوئے حالات کے پس منظر کی نمائندگی کرنا اور اسکے بعد اس پر شماریاتی دلچسپی کے امکانات کا حساب نکالنا ہے.  بعدازاں ٹیسٹ ڈیٹا سیٹ پر بھی انہی شماریاتی امکانات کا دوبارہ حساب لگایا جاے گا اور ان دونوں شماریاتی امکانات کی تفریق اس بات کو وضاحت دیگی کہ دونوں عناصر میں کس قدر فرق موجود ہے.، جس کی بنیاد پر اسکی افادیت کی درجہ بندی کی جاسکتی ہے۔

LightSummerReading

اب میری تحقیق اس مرحلے میں داخل ہو چکی ہے جس میں میں ایسے شماریاتی احتمالی امکانات کے پیمانوں پر خاص توجہ دے رہا ہوں جو صرف اس وقت زیادہ تبدیل ہوتے ہیں جب کوئی نایاب دلچسپی کا عنصر ڈیٹا سیٹ میں نظر آتا ہے مثلآ اگر آپ کی ساری خریداری کراچی میں ہو اور دن بھر کا خرچا عموما پانچ سو سے کم رہتا ہو اور اب اچانک آپ کے اکاؤنٹ میں لاہور کی ایک ٹرانزیکشن آجاۓ جو دس ہزار روپے کی ہو توفراڈ کے ماہرین کے لئے یہ نہایت غیر معمولی اور نادر دلچسپی کی چیز ہے لیکن اس کا تناسب پورے ڈیٹا سیٹ یا اسٹریم میں بہت کم ہوتا ہے.یہ ایک آسان مثال ہے جو یوکلیڈین فاصلے سے بھی نکالی جا سکتی ہے لیکن اگر ڈیٹا ہمہ جہتی ہو تو فاصلے اور گروہ بندی کے طریقہ کار اتنے کار آمد نہیں رہتے۔ فاصلہ ماپنے کے طریقہ کار کی بنسبت اس تحقیقی طریقے کار کا ایک اور بڑا فائدہ یہ ہے کہ اس انکشاف کو اتصالی ماڈل کے ذریعے نہایت آسانی کے ساتھہ واضح طریقے سے بیان کیا جا سکتا ہے.نیز کسی ماہر کے ذریعے اس نمونے کو تبدیل کرنا بھی نسبتاآسان کام ہے.

History-Bayesian-Inference-Network-Adnan-Masood-Adnan-Darwiche

اس وقت میرے تحقیقی سوالات کا دائرہ کار انہی امور کے تجربات کے گرد گھوم رہا ہے کہ کونسے ایسے امکاناتی دلچسپی کے پیمانہ جات ہیں جن کی درجہ بندی سے استثنائی اشیاء کو بہترین طریقے سے جانا جا سکتا ہے. ان تجربات میں انسامبل طریقہ کار کو بھی مد نظر رکھا جا رہا ہے جس کے مطابق کسی ایک امکاناتی دلچسپی کے پیمانے کے بجاۓ عصر کلّی کو دیکھا جاۓ اور مختلف پیمانہ جات کو ان کی بنا پر ضم کردیا جاۓ.کورس ورک ختم کرنے اور تحقیقی کام میں اس مقام تک پہنچنے میں مجھے تقریبآ چارسال کا عرصہ لگا ہے اور امید ہے کہ ایک سے ڈیڑھ سال کے دوران ان تحقیقی سوالات کے جوابات دینے کے قابل ہو جاؤنگا اور اپنا مقالہ مکمل کر لوں گا، انشا اللہ.۔

امید ہے کہ آپکو یہ مضمون پسند آیا ہوگا اور احقر کے تحقیقی کام سے گو نہ گو آشنائی حاصل ہو گئی ہوگی۔

نوٹ – یہ مضمون ہماری والدہ محترمہ کی ۵۹ ویں سالگرہ کے موقع پر ان کو اور والد صاحب کو اپنے تحقیقی کام کے بارے میں معلومات فراہم کرنے کے لئے لکھا گیا تھا جس کو بعد ازاں عمومی مصرف کے لئے یہاں پیش کیا گیا۔

path-to-phd

Share

Powered by WordPress