مردم چه قبل از استفاده از گوگل برای جستجو در وب ؟
در سال 1997. شما در حال پوشیدن هر آنچه که مردم به تن آن—نوعی از ژان قنتد, ژاکت, من حدس زدن و صحبت کردن با دوستان خود را در مورد علاقه جدید خود را فیلم که به تازگی منتشر شده Mike Myers خودرو Austin Powers. شما در حال نقل و دوستان خود فکر می کند این خنده دار است. سپس همه چیز را تیره و روشن. "من فکر Randy Quaid عالی بود" دوست خود را می گوید. "Randy Quaid?" شما فکر می کنم تلاش سخت به پانچ دیوار. "Randy Quaid نبود در Austin Powers." شما سعی کنید در توضیح این موضوع به دوستان—"من باور دارم" به شما می گویند tersely "که شما به فکر Clint Howard"—اما دوستان خود مصمم است. به حل و فصل این مناقشه و نجات آنچه باقی مانده است از دوستی خود را به شما راه اندازی خود را 90 پوند کامپیوتر برج. چهل دقیقه بعد شما را ساخته اند آن را بر روی اینترنت. حال سؤال این است که: کجا میری ؟ چگونه قبل از گوگل انجام داد مردم حل و فصل نادان اختلافات و/یا پیدا کردن انواع دیگر از اطلاعات ؟ برای این هفته Giz می پرسدما رسیده به تعدادی از کارشناسان برای پیدا کردن.
آملیا Acker
دستیار استاد, اطلاعات, دانشگاه تگزاس در آستین که تحقیقات در رابطه با ظهور استاندارد و حفاظت از اطلاعات جدید اشیاء در تلفن همراه و سیستم عامل رسانه های اجتماعی
گوگل جستجو در غالب بیش از 90 ٪ از بازار است که شامل موتورهای جستجو مانند یاهو و بینگ و حریم خصوصی رانده DuckDuckGo. اما قبل از اینکه گوگل شخصی آگهی-رانده جستجو الگوریتم در زمان بیش از تقریبا همه چیز ما می توانید پیدا کردن در وب, وجود دارد, دایرکتوری وب سایت و ایندکس شده در موتورهای جستجو که مونتاژ منابع وب با موضوع.
اولین وب سایت در موتورهای جستجو بودند دایرکتوری وب سایت های سرپرستی مردم است. این وب ontologists (یاهو آنها را به نام "خوانندگان") خواهد خواندن تمام صفحات وب مورد موضوعات خاص و سپس آنها را رتبه بندی. در نهایت این انسان محور مدل طبقه بندی جایگزین شد خزنده وب سایت با رباتها (گاهی اوقات به نام عنکبوت) و سپس رتبه بندی وب سایت های با قابلیت اطمینان و ارتباط به انواع مختلف جستجو نمایش داده شد. در اوایل 1990s وجود دارد حدود بیست موتورهای جستجوی مختلف به از را انتخاب کنید از جمله WebCrawler لیکس آلتاویستا و Yandex. شبیه به کتابخانه کاتالوگ این موتور جستجو شاخص های وارد شده بودند و سازمان یافته با موضوع و محتوا و ساختار و موضوع. اوایل موتورهای جستجو طراحی شده بودند به طوری که کاربران می تواند حرکت به بسته نرم افزاری از لینکهایی منابع مختلف در سراسر سطح بالا دسته بندی "اخبار" "سفر" "ورزش" و "کسب و کار است." ستون دسته گسترده ای کهنه هم پر از آبی لینک برای کاربران را انتخاب کنید از ساخته شده در اوایل موتور جستجو صفحات شبیه شلوغ شاخص در پشت یک کتاب درسی.
این مهم است به یاد داشته باشید که 1990s جستجوی وب تا به حال اهداف مختلف و انگیزه برای مردم "گشت و گذار در وب است." در اوایل آنلاین فرهنگ پیدا کردن یک واقعیت یا محصول نیست همیشه هدف از جستجو. در عوض موتورهای جستجو کمک به مردم کشف و اکتشاف منابع دیجیتال و تجربه شبکه جهانی وب است. جستجو در وب در دهه 1990 تا به حال کمتر ad-هدف قرار دادن و به کاربران کنترل بیشتری برای کشف حتی اگر نتایج ابتدایی و نه همیشه قابل اعتماد فیلتر کردن انجمن. نسبت به امروز را تجربه جستجو در اوایل جستجو در وب بود و بیشتر از یک جستجوی تجربه. با تلاش منظورم در نظر گرفتن نقش فعال در مرور و کشف محتوا در راه است که شخصی سرپرستی جستجو از سیستم عامل های مانند گوگل و Facebook را تا حد زیادی غصب با مخاطبان تبلیغات هدفمند. اجازه دهید من به شما یک مثال از یک پرماجرا اولیه جستجو در وب اعزامی. یک زمان وجود دارد که در جستجوی آهنگ و متن ترانه برای "شهر کوچک پسر بچه" می تواند منجر شما به محل اول, آلمانی, صفحه فن برای جیمی سامرویل. این روزها اگر شما در جستجوی آهنگ, شعر, گوگل گزیده ای از شعر از یک وب سایت مانند LyricFind.com. هنگامی که شما حرکت می کند از یک جستجوی تجربه دقیق الگوریتمی تجربه جستجو می شود معمول و نسبتا تجویزی است. شما ممکن است دقیقا آنچه شما می خواهید با جستجو در گوگل, اما شما به احتمال زیاد به از دست دادن مقدار زیادی از این نعمت غیر مترقبه امکانات و دسترسی به عجیب و غریب ناهمگن محتوا ساخته شده است که در اوایل وب بسیار سرگرم کننده و هیجان انگیز به اکتشاف.
امروز هنگامی که ما بحث در مورد "جستجو" ما معمولا فکر کردن در مورد مرور شاخص و یا بازدید از یک صفحه وب. ما در حال فکر کردن در مورد پیمایش و کشیدن اطلاعات از نوع feeds ها و برنامه های است که گرد هم آوردن تعداد زیادی از محتوای مختلف و پروفیل های کاربر به یک جریان. یا شاید ما انتظار دقیق جواب به خدمت گرفته شود تا به عنوان یک استخراج قطعه از اطلاعات از یک منبع آنلاین. مدرن ترین ویژگی های جستجو به خصوص جستجو در سیستم عامل هایی مانند Facebook, آمازون یا App Store پولی روند و حتی بیشتر با جمع آوری بیشتر و بیشتر اطلاعات کاربر به نقطه که در آن ردیابی رفتار کاربر مانند عبارات جستجو و مرور عادات تقریبا همیشه مورد نیاز برای مردم را به استفاده از این به طور فزاینده خدمات ضروری است. هنگامی که ما از خود بپرسیم چه چیزی ما را از دست داده ایم با در نظر گرفتن این زودتر موتورهای جستجو ما باید سعی کنید و تصور کنید که همه امکانات ما وام با اعطای انحصار جستجو در تمام جهان' آنلاین, اطلاعات دیجیتال به یک شرکت مانند گوگل و از خود بپرسیم: چه چیز دیگری می توانم گشت و گذار در وب است ؟
کریستین L. Borgman
برجسته تحقیقات استاد, اطلاعات, مطالعات دانشگاه کالیفرنیا در لس آنجلس و نویسنده از داده های کمی داده ها شامل: کمک هزینه تحصیلی در شبکه جهانی
در '90s یاهو و آلتاویستا ، اما کامپیوتری بازیابی اطلاعات بسیار قدیمی میدان قدمت آن حداقل به 1950s. اول تجاری آنلاین دسترسی از راه دور سیستم ها به اوایل 1970s.
گوگل اختراع نشده اطلاعات-بازیابی هر وسیله آن ساخته شده است در روش های قدیمی از اسناد و مدارک از جمله کسانی که از پل Otlet که اختراع جهانی طبقه بندی دهدهی در دهه 1930 و در میان پدر و مادر مدرن علم اطلاعات.
تاریخ آنلاین اطلاعات-بازیابی نظم و انضباط است-خاص—بسیار عمیق متخصص نمایه سازی در زمینه های پزشکی و متالورژی و علم مواد, شیمی, مهندسی, آموزش, علوم اجتماعی. ما تا به حال بسیار خوب پایگاه داده های آنلاین در اوایل دهه 1970 که به صورت تجاری در دسترس—شما پرداخت شده توسط اتصال دقیقه است.
برخی از Google ترین اصول اساسی بیرون آمده از td-اسرائیل و یا متن فرکانس بار معکوس سند فرکانس یک مفهوم است که از یک کمبریج تز دکترای خود را در سال 1958 توسط کارن Spärck جونز. روش خود را درگیر به دنبال فرکانس یک مدت در بدن از کار و تقسیم که توسط معکوس چگونه اغلب اسناد رخ می دهد. او واقعا یک پیشگام و بعدها مشورت برای گوگل همراه با بسیاری دیگر از قابل توجه اطلاعات دانشمندان است. صفحه برین شد قطعا عمیقا تحصیلات در این تاریخ است.
گوگل از کتابخانه دیجیتال ابتکار یک پروژه به رهبری توسط بنیاد ملی علوم و مربوط به 8 یا 10 های مختلف سازمان های فدرال. من تا به حال کمک های مالی از آن یاد همه دست به جلسه که برین و صفحه تا به حال یک, پوستر, پیشنهاد گوگل. من به یاد داشته باشید: این است که واقعا سرد آنها به ابداع bibliometrics برای وب است.
Bibliometrics وسیله ای برای ایجاد ارتباط بین اسناد و مدارک و پس از آن به دنبال شبکه می باشد. این روش بسیار مفید است به دنبال موضوعات که در آن اصطلاحات تغییرات در طول زمان. برای مثال اگر شما می خواهید برای پیدا کردن آنچه قبل از مدرن سقط جنین بحث های شما می خواهم به یک Roe v. Wade بحث از اواسط دهه 1970 و به دنبال همه چیز در آن ذکر شده و همه چیز را که ذکر آن, بنابراین شما می توانید در هر دو جهت.
Science Citation Index نیز آغاز کرده است در 1950s, آورده, پیر اصول کتابخانه علوم تکنولوژی مدرن. Bibliometrics و استنادی نمایه سازی ایده هایی که ممکن است به ترسیم قرن به تحولات مانند کتاب مقدس حاشیه نویسی.
صفیه Umoja شریف
دانشیار اطلاعات مطالعات و همکاری مدیر UCLA Center for Critical اینترنتی پرس و جو در UCLA و نویسنده از الگوریتم های ظلم: چگونه موتورهای جستجو تقویت نژاد پرستی
یکی از مهم ترین ابعاد اولیه اینترنت به اشتراک گذاری اطلاعات بود که کارشناسان موضوع از کتابداران به دانشمندان متخصص علاقمندان بودند مهار کشت و سازماندهی دانش است. آنچه این بود را به انسان درگیر در این شیوه قابل مشاهده حتی به عنوان هوش مصنوعی و ابزارهای جستجو توسعه داده شد. ما قابل درک است که مردم قدرت چیزی است که ساخته های آنلاین اتفاق می افتد و ما به دنبال کشف کردن آنچه که معتبر بر اساس جیب وب سایت های موفق توسط سازمان ها و به خصوص دانشگاه ها و پژوهش سازمان.
اول موتورهای جستجو شد در واقع کتابخانه های مجازی و بسیاری از مردم درک ارزش از کتابخانه به عنوان یک مکان خوب است. به عنوان اتوماسیون افزایش یافته و کتابداران و کارشناسان جایگزین شد با AI ما مقدار زیادی از دست داده. عمومی خوب است که می تواند متوجه شده اند جایگزین شد با تبلیغات گسترده سیستم عامل مانند Yahoo! و گوگل.
در حال حاضر تخصص برون سپاری است و اغلب بهینه سازی محتوا برای پرداخت بالاترین پیشنهاد در AdWords. این منجر به یک شکاف بزرگ بین دانش و تبلیغات در موتورهای جستجو به ویژه هنگامی که در تلاش برای درک مسائل پیچیده است. در برخی از راه جستجو است تضعیف ما اعتماد به تخصص و تفکر انتقادی حمایت بررسی آمار و تحقیق و سمت چپ ما باز به دستکاری توسط تبلیغات. موتورهای جستجو ممکن است بزرگ در کمک به ما در پیدا کردن اطلاعات پیش پا افتاده اما آنها نیز حساسیت ما به ارزش آهسته عمدی تحقیقات—نوعی که برای بیشتر مطلع دموکراسی است.
ایان Milligan
دانشیار تاریخ دانشگاه واترلو و نویسنده تاریخ در عصر وفور: چگونه وب است تبدیل پژوهش های تاریخی
گوگل شد البته اولین موتور جستجو برای وب است. قدمت آن به سال 1993 وجود دارد Wandex (یا World Wide Web Wanderer) که به اندازه وب و منجر به یک فهرست قابل جستجو; به Lycos و Infoseek در سال 1994 و دایرکتوری ها مانند Yahoo! در سال 1995.
بسیاری از این اوایل موتورهای جستجو یا دایرکتوری اما نسبتا clunky. اگر شما یک خالق وب سایت شما را در بسیاری از موارد مجبور به پر کردن یک فرم برای اضافه شدن به فهرست و یا نیاز به قرار دادن نسبتا دست و پا گیر متا تگ ها به HTML خود را. توسط اواسط 1990s به عنوان بیشتر و بیشتر مردم شروع به ایجاد وب سایت و میزبانی آنها را بر روی شخص ثالث سیستم عامل آنها همیشه نیست ثبت نام سایت خود را.
بخشی از دلیل این است که اولیه وب سایت می تواند با تکیه بر لینک–به مراتب بیشتر از ما امروز در عصر ما از جستجو برای آوردن بازدید کننده به سایت خود را.
این WebRing یک مثال عالی از این است. این WebRing توسعه داده شد در سال 1995 توسط یک جوان توسعه دهنده نرم افزار به نام سیج. WebRings شد گروه از وب سایت ها که به صورت موضعی واحد و یکپارچه. بنابراین افراد علاقه مند به اتومبیل های قدیمی خواهد پیوستن به خودرو علاقه مندان WebRing گربه, دوستداران گربه متمرکز WebRing و غیره. در پایین این صفحات خواهد بود WebRing رابط کاربران تشویق به رفتن به "بعدی" سایت و یا "قبلی" سایت و یا حتی به طور کلی اول از همه که به پیوست حلقه.
این خیلی دموکراتیک و قابل دسترس روش برای کشف سایت. هر کسی می تواند شروع یک وب سایت حلقه هر کسی می تواند با پیوستن به یکی اگر مدیر به فکر آنها مناسب به جامعه است. مهمتر آنها با تشکیل یک راه جدید برای اتصال مردم است. اوج WebRings به طول انجامید تا حدود سال 2000 هنگامی که فن آوری به پایان رسید تا در دست Yahoo! و برخی از مدیریت تغییرات به پایان رسید تا بیگانه کاربران است.
من نمی خواهید به بیش از حد دلتنگ: من نمی خواهم برای رفتن به یک جهان که در آن ما کشف مطالب بیشتر از طریق لینک من استفاده از گوگل به عنوان مقدار به عنوان هر کس دیگری. اما راه که گوگل کار می کند با تشکر از رتبه صفحه است که بیشتر لینک هایی که به یک سایت است که به آن از نفوذ سالن های بالاتر در نتایج جستجو صفحات آن می رود. این اثر از هدایت ترافیک به چند برندگان بزرگ. اگر من جستجو برای "گربه" من ممکن است کشف بالای ده و یا پس از تقریبا چهار میلیارد نتایج. جایی در آن میلیاردها صفحات وجود دارد بدون شک خنک صفحات توسط افرادی که واقعا عاشق گربه خود را. در سال 1998 از طریق کلیک کردن یک webring وجود دارد یک شانس من کهکشان کشف برخی از مطالب جذاب و یا شروع به احساس می کنید برخی از جامعه از طریق پیدا کردن افراد همفکر. که سخت تر برای پیدا کردن با گوگل.
اتان زاکرمن
دانشیار عمل در رسانه هنر و علوم در دانشگاه MIT Media Lab, مدیر مرکز مدنی رسانه ها در MIT و نویسنده دیجیتال عموم جهان وطن: چرا ما فکر می کنم اینترنت متصل ما چرا آن را نمی کند, و چگونه به Rewire آن
خوب در آن روز ما با استفاده از چندین موتورهای جستجو مختلف که زد بر دو فلسفه: TFIDF و انسانی و گزینش.
TF-IDF مخفف "اصطلاح فرکانس معکوس سند فرکانس." آنچه که بدان معنی است که یک موتور جستجو خود را در زمان پرس و جو—"قاطر قدرت"و نگاه به اسناد و مدارک که شامل مدت است. اما آن را نیز در نظر چگونه معمول این اصطلاح را در سراسر مجموعه به عنوان یک کل برای جلوگیری از overmatching در شرایط عادی. بنابراین در جستجوی "قاطر قدرت" یک TF-IDF موتور است که به احتمال زیاد ترجیح می دهند اسنادی که قاطر بیش از کسانی است که ذکر قدرت به دلیل قدرت بیشتر رایج کلمه از قاطر.
TF-IDF آسیب پذیر است به یک نوع خاص از نرم. اگر من می خواهم به شما فروش جدید من قاطر طراحی مرورگر وب (که همه آنها خشم در اوایل 1990s...) من فقط پست یک صفحه وب است که می گوید: "قاطر قدرت" و بیش از بیش. هیچ سند در وب است که یک بازی بهتر از آن است که برای پرس و جو خود را, بنابراین من می آیند تا #1 در هر زمان. این ضعف است که منجر لری پیج و سرگئی برین به کار بر روی صفحه رتبه بندی. ایده این بود که صفحات مانند من دادن صفحه خواهد بود و بعید است به مرتبط در حالی که صفحات مفید خواهد تعداد زیادی از لینک های ورودی. گوگل اساسا ازدواج TF-IDF به رتبه صفحه برای راه اندازی اولیه خود را موتور جستجو. (مردم نمیفهمد چگونه به بازی رتبه صفحه و همچنین ایجاد مزارع از صفحات وب که تمام گفت: "قاطر قدرت" و مرتبط با یکدیگر است. گوگل بیشتر ایجاد الگوریتم های پیچیده در پاسخ. حال پیشرفت است. مردم را با استفاده از قاطر صفحه مرورگر و بخار مرورگر جدید شد گرما. به معنای واقعی کلمه—شما می توانید خود را سوزاند واقعا بد در یک اگر شما دقیق نیست.)
Lycos که من به طور خلاصه کار کرده و پس از خرید سه پایه شرکت من کمک کرد, راه اندازی, زد TF-IDF آیا به عنوان تحریک HotWired و آلتاویستا که من به یاد داشته باشید به عنوان بهترین از این دسته است.
TFIDF هرگز کار به خصوص به خوبی. گذشت زمان, هوشمند موتورهای جستجو کشف شده که 30%-50% از نمایش داده شد می تواند حل شود با دست-سرپرستی صفحات جستجو. برای مثال اگر شما جستجو "قاطر نژاد نتایج" شما در پیدا کردن صفحه ای که برجسته ذکر شده که عبارت بود احتمالا مفید نیست—ارسال شما به صفحه اول AMF (آمریکا Muleracing فدراسیون) خواهد بود نتیجه بهتر است. Lycos خدمت حداقل 30% دست طراحی صفحات نتایج زمانی که من سمت چپ در سال 1999.
یاهو, در مقابل, در ابتدا زد کاملا انسانی سرپرستی اساس. نبود یک موتور جستجو, اما یک دایرکتوری. هنگامی که شما جستجو برای "قاطر مسابقه" آن را به شما نشان می دهد که در آن قاطر مسابقه در جا های مختلف سلسله مراتب:
ورزشی> ورزش لیگ -> مسابقه -> قاطر مسابقه
و سپس لینک به AMF OOM (فقط اذیت کننده قاطر) و ESPN (سرگرمی و مالداری برنامه نویسی شبکه)
حقوق -> سوء استفاده از حیوانات -> قاطر مسابقه
و سپس به حیوان خانگی ' اونا (مردم برای درمان اخلاقی از قاطر)
چه بزرگ بود در مورد این است که آن می تواند به شما نشان دهد که چگونه یک نهاد (AMF) جا به جهان بزرگتر و از قاطر-مسابقه. این فوق العاده بود به خصوص اگر شما تحقیق در مورد شرکت به عنوان شما می توانید به سرعت پیدا کردن رقبای بالقوه و یا تامین کنندگان مختلف. اما این یک درد سلطنتی در ساخت نیاز واقعی انسان taxonomists به نگاه در سایت ها و کشف کردن که در آن آنها فرود آمد در سلسله مراتب. و خدا به شما کمک کند هنگامی که کسی اختراع چیزی جدید مانند بخار شده مسابقه قاطر. می کند که تحت قاطر مسابقه یا بخار قدرت ؟ هر دو ؟ و یا یک رده جدید به طور کامل به رسمیت شناختن ظهور جدید ورزشی لیگ مانند نسکار (فعال ملی بخار گاو همراه مسابقه)?
یاهو! واقعا خوب کار کرد برای اولین بار چند سال وب سایت, اما آن را سنگین و شکستن توسط 1997 و یا پس آنها شروع به برون سپاری جستجوی خود را به شرکت های دیگر (Excite در اولین... بینگ در حال حاضر.) من آن را از دست, اگر فقط به این دلیل آن را جذاب بود به راه که مردم انتخاب کرده برای سازماندهی کل دانش بشری. (Melvil دیویی اختصاص داده 200s به "دین" و پس از آن اختصاص داده شده 220-280 های مختلف به موضوعات مختلف در مورد کتاب مقدس است. این 290s در مورد "سایر ادیان"... از جمله بودیسم و هندو و غیره.)
آن را سخت به تصور کنید که یاهو به آینده را—آن را فقط بیش از حد سر در گم کار می کنند. در یک حس انسانی-سرپرستی جستجو در صفحات ساخته شده اند چیزی از باز گشت. بسیاری از نتایج گوگل صفحه نیست TF-IDF نوع جستجو در وب اما یک صفحه ساخته شده از پایگاه داده های مختلف نمایش داده شد جستجو برای آب و هوا و گوگل با استفاده از منطقه جغرافیایی برای تعیین جایی که شما هستند می یابد و آب و هوای محلی اخبار از db. من در واقع فکر می کنم صفحات سرپرستی انسان - کتابداران با هم کار ویکیپدیا سبک برای نمونه ممکن است یک راه حل عالی برای نحوه رسیدگی به سرعت در حال ظهور موضوعاتی که تمایل به ربوده سیاسی با افراط گرایان و یا disinfo بازرگانان.
همانطور که برای چه من را از دست ندهید: من از دست قاطر. من قاطر-صفحه مرورگر نت اسکیپ کند بود اما من از دست کسانی که نسیم تا حدی ریتم چرا وب است.
آیا شما یک سوال سوختن برای Giz می پرسد ؟ به ما ایمیل در tipbox@gizmodo.com.
tinyurlis.gdv.gdv.htclck.ruulvis.netshrtco.de