יום שני, 10 בינואר 2011

אחזור מידע

"הדבר החשוב באמת סמוי מן העין" מתוך הנסיך הקטן אנטואן דה סנט אכזפרי


הצורך להתייחסות חדשה לניהול המידע התעורר במהלך מלחמת העולם השניה עם הפיתוח הטכנולוגי המואץ. מערכות המידע והכלים המסורתיים לאחזור מידע לא הצליחו להתמודד עם כמויות גדולות של מידע שיצאו לאור בעקבות המלחמה. הקושי להשיג מידע מדוייק במהירות גרם להתעלמות ממידע רלוונטי או לכפילות. לפיכך נוצר הצורך לאחסון וארגון המידע באופן כזה שיהיה מהר וקל למצוא את המידע המבוקש.
אחזור מידע הוא ענף במדעי המחשב העוסק באחסון מסמכים על גבי אמצעי מדיה דיגיטליים ובמציאת (כלומר - אחזור) מסמכים מסוימים מתוך אוסף מסמכים עצום הנמצא על תקליטור, על הדיסק הקשיח של המחשב, זיכרונות נשלפים, או מפוזרים ברחבי הרשת. כמו בספריה רגילה כך גם בספריה דיגיטלית, אחסון המידע צריך להתבצע בצורה כזו שפעולת האחזור תהיה מדויקת ומהירה והמסמכיםשמתקבלים כתוצאה משאילתה יהיו המסמכים הרלוונטים למשתמש. תהליך דליית המידע יכולה להתבסס על אסטרטגיות וטכנולוגיות חיפוש מגוונות ושונות. ישנן שלוש אסטרטגיות לדליית מידע ממאגרי מידע או מאוסף מסמכים. חיפוש כתובת ישירה, חיפוש בקטלוגי אינטרנט (אינדקס), חיפוש במנוע חיפוש לפי מילות מפתח או מחרוזת חיפוש. על מנת לבצע את פעולת האחזור עלינו להגדיר למאגר מה בדיוק אנו מחפשים. המשתמש (מאחזר המידע) המיומן יידע לתכנן ולהגדיר אסטרטגיית חיפוש ולהציב תנאי חיפוש כאלו שיאחזרו לו קטעי המידע או הפריטים המבוקשים באופן היעיל ביותר.
מערכות אחזור המידע הראשונות היו מבוססות על קטלוגי אינטרנט (אינדקס מילת מפתח ותיאורים מקוצרים שהיו מייצגים כל מסמך. האדם מצא אתרים באינטרנט העריך, בינן וקטלג אתרים אלו, וערך אותם בעץ נושאים לפי שיטתו.השימוש באינדקס שכזה לא היה יעיל היות שהזמן וההשקעה בבנייה ידנית של האינדקסים היו גדולים ולא הייתה בהם תועלת רבה נוכח כמויות המידע שהלכו והצטברו עם הזמן. בעיה נוספת היא אחידות הקטלוג צריך היה לסמוך על בוני האינדקסים שיקצו לכל מסמך מילות המפתח הנכונות ושהתיאור המקוצר של תוכן המסמך אכן יתפוס את עיקר התוכן במסמך.
מנוע חיפוש היא מערכת אחזור מידע, המעוצבת כדי לאתר מידע דיגיטלי (קבצים או תוכן) המאוחסן במערכת המחשב. צורת החיפוש הנפוצה והגלויה ביותר כיום היא מנוע חיפוש אינטרנטיים. מנוע חיפוש מנגיש מידע למחפש, עוזר לצמצם את הזמן הנדרש כדי למצוא מידע, ועוזר להתגבר על הצפת המידע הקיימת כיום במדיה הדיגיטלית. בעזרת מנוע חיפוש ניתן למצוא מידע רב: ממסמכיםותמונות העוסקים בנושא מסוים, ועוד מוצרים. עקרון הפעולה הבסיסי של מנוע חיפוש הוא שהלקוח ממלא שאילתא המציגה את המידע הנחוץ ושולח אותה לשרת, השרת מפעיל יישום לביצוע הפעולה, תוך הפעלת אלוגריתמים שנועדו לסנן את התוצאות כך שיהיו רק בנושא שהלקוח מחפש.
אחזור מידע ברשת הוא תהליך המסתמך על יישום שיטות של אחזור סטטיסטי. הגידול המתמשך במימדים ובשימוש של הרשת העולמית מחייבת דרכים חדשות של עיצוב ופיתוח שירותי מידע ברשת. רוב המבנים ברשת גדולים ומורכבים ולעיתים קרובות מחמיצים המשתמשים את מטרת החיפוש או מקבלים תוצאות מעורפלות כאשר הם מנסים לנווט דרכה. מאידך הסקטור המסחר ברשת מתפתח במהירות והצורך בשווקים אלקטרונים הצופים את צרכי הלקוחות ניכר יותר מאי פעם. המטרה של אחזור אופן השימוש ברשת הנה לאסוף אינפורמציה בנוגע להרגלי הגלישה של מבקרי אתר. ניתן ליישם את הצורך לצפות את צרכי המשתמש כדי לשפר את אופן השימוש ונוחות המשתמש באתר באמצעות התאמה אישית של האתר.
כדי לאפיין את המשתמש משתמשים באיסוף נתונים אודות הרגלי הגלישה של המשתמש לרוב ללא ידיעתו וללא אישורו וכאן מתעוררת שאלה למחשבה האם אין כאן הפגיעה בפרטיות ?

3 תגובות:

  1. לאה,
    אכן סוגיית הפרטיות היא סוגייה מעניינת וגם קצת מפחידה....האם באינטרנט יש הגנה על הפרטיות? או שיש יותר דרכים לפגוע בפרטיות הגולשים?!

    השבמחק
  2. לאה,
    נגעת בנקודה מטרידה מאוד.
    החשיפה ברשת האינטרנט מאפשרת איסוף מידע תמידי על גולשים... הרגלי הצריכה שלהם, מקומות הבילוי שלהם, אני מאוד מוטרדת מנושא זה! ומעצם המחשבה שהאח הגדול צופה בנו כל העת. האם ניתן למנוע זאת? אני כלל לא בטוחה נראה לי שזה רק ילך ויחמיר.

    השבמחק
  3. לאה
    בעלמנו היום אנו חשופים כמעט לכל פרט של מידע ובשנה האחרונה יש מאבק עצום על החוק הביומטרי שכך בעזרת האצבע שתחליף את הדרכון אנו ובו יהיה פרטים מזנים כתובים ואלקטרונים עלינו החוק עבר בקריאה ראשונה ויש דעות חלוקות בעד ונגד.הרוב שתומך טוען ובצדק שכיום יש 350,000 בני אדם מצויידים בתעודות זהות מזוייפות ו40 אחוז מהפיגועים שהיו במדינת ישראל היו מאורבים ערבים בעלי תעודת זהות מזוייפות,בנוסף בתעודות הזהות התמונה לא תמיד עדכנית ואפילו הקובים לנו לא יכולים לזהותינו על פי התמונה.
    הגורסים נגד החוק טעונים גם בצדק שאינם רוצים להיות חשופים לכול ופגיעה קשה בפרטיותם.
    אורי

    השבמחק