Thursday 19 May 2011

The analysis of the Web (Analisis Web)

4.1 Web Topologi
4.1.1 Struktur Web
Web adalah demokratis sejauh bahwa tidak ada sentralisasiatau pusat koordinasi yang menghubungkan. Setelah rantai link, juga diberikan kurang berisiko oleh Web browser yang berisi tombol 'kembali' yang berlaku memberikan kebalikan dari hyperlink apapun. Topologi web berisi kompleksitas lebih dari rantai linier sederhana.
Pada bagian ini, kita akan membahas upaya untuk mengukur struktur global dari Web, dan bagaimana halaman web individu masuk ke dalam konteks itu.  Sebagai contoh, mungkin itu mungkin untuk pengetahuan peta di theWeb? Seperti peta memungkinkan pemahaman komunitas online, atau untuk terlibat dalam 'membanggakan melacak'. Mengingat peta tersebut, kita dapat membayangkan bercak masalah seperti Slashdot surge (yang memperlambat atau penutupan sebuah website setelah baru dan besar. Populasi pengguna mengikuti link dari sebuah website populer, sebagaimana terjadi dari situs dari majalah online Slashdot) sebelum mereka terjadi - atau setidaknya mampu mengintervensi cukup cepat untuk memulihkan normal atau jasa dapat diterima segera setelah itu. 
Metode analisis web melihat pola link ternyata sangat menarik, mencerahkan dan kuat dalam struktur yang mereka temukan. Sebagai contoh, beberapa situs sepertinya harus diambil karenaberwibawa dalam beberapa cara - dengan kata lain, banyak situs lain link
ke dalamnya. Hub tersebut juga dapat otoritas,tetapi oleh mereka mungkin ditunjukkan oleh beberapa halaman atau bahkan tidak ada halamansama sekali. 

Ada beberapa metrik yang tersedia untuk teori grafik. Langkah-langkah Sentralisasi memberitahu kita bagaimana tersambung sebuah node dibandingkan dengan node lain grafik, dan karena itu dapat membantu memberitahu kita mana yang paling "pusat" node. Jumlah jarak ke node lain (jarak keluar) dan jumlah jarak dari yang lain node (dalam jarak), di normalkan untuk ukuran grafik itu sendiri, dapat menjadi informatif. Sebuah node sentral akan menjadi salah satu yang memiliki relatif total rendah masuk dan keluar jarak, dalam kontras node terkubur jauh dari node pusat kurang mungkin dicapai oleh suatu rantai link. Pengetahuan yang merupakan node pusat, khususnya node yang relatif outcentral (Misal ada banyak link dari yang node ke node lain), adalah suatu langkah penting pertama untuk menavigasi melalui hyperspace. Pusat tersebut node berguna untuk mencapai poin sewenang-wenang dalam grafik. Global metrik melihat penggalian informasi tentang grafik sebagai
keseluruhan. Kekompakan adalah ukuran tentang bagaimana terhubung grafik, sebuah
grafik kompak berarti bahwa, secara umum, adalah mudah untuk mencapai suatu randomlychosen node dari yang lain. Ukuran biasa memiliki jangkauan antara 0 (benar-benar terputus node) dan 1 (sambungan universal). Kekompakan dari 0 jelas harapan untuk ruang informasi, tapi mungkin kurang jelas grafik tidak boleh terlalu kompak baik, jika penulis halaman Web yang hemat dan bijaksana tentang apa yang mereka link ke, mereka link yang lebih mungkin untuk digunakan. Ada juga metode untuk menemukan apakah grafik seimbang atau tidak seimbang, yaitu beberapa bagian grafik kurang baik terhubung dibandingkan dengan orang lain, dan karena itu mungkin hilang informasi. Saldo adalah properti dari sebuah node individu pada grafik, dan dimaksudkan untuk mengekspresikan intuisi bahwa, dalam cukup sumber daya ekspresif Web, link dapat diartikan sebagai lebih lanjut perkembangan ide-ide dalam sumber daya, dan oleh karena itu jika beberapa dari hubungan yang sangat luas dan lainnya agak jarang berhubungan, maka mungkin saja kasus yang menunjukkan mantan sangat baik dikembangkan topik sementara yang kedua dapat ditingkatkan dengan penambahan lebih lanjut link.
Struktur Web adalah hipotesis menjadi grafik dunia kecil, di mana jalur terpendek antara node lebih kecil dari satu mungkin mengharapkan grafik yang ukuran. Bersamaan dengan wawancara pakar, analisis itu digunakan untuk mengungkap pola penggunaan, dan melemparkan cahaya pada pertanyaan apakah struktur Web menciptakan ilmu pengetahuan, demokratis terdesentralisasi mana pemasok berbagai informasi yang digunakan, atau alternatif pemenang-mengambil-semua Web di mana ada pusat informasi yang penting
mendapatkan pasokan diperkuat. Perbedaan topologi yang mengikuti yang signifikan;
misalnya, dengan jaringan dengan distribusi Poisson, maka akan secara eksponensial jarang ditemukan node dengan link substansial lebih dari mean, sedangkan distribusi kuasa hukum menentukan sebuah topologi mana banyak node beberapa link, dan sejumlah kecil tapi signifikan sudah sangat banyak. Dalam jenis grafik yang biasa acak, jumlah rata-rata link per node sangat penting untuk menentukan struktur, karena Distribusi Poisson jumlah link.
Konektivitas dari Web juga terdistorsi oleh clustering, sedangkan  probabilitas dari dua tetangga dari node yang diberikan juga dihubungkan  jauh lebih tinggi daripada acak. Pemetaan invariants tidak hanya membawa kita lebih dekat dengan gambaran yang jelas fenomena Web, tetapi juga memungkinkan standar untuk generasi berikutnya dari Web untuk dikembangkan yang melestarikan aspek-aspek penting struktur Web saat memungkinkan untuk pertumbuhan dan peningkatan kegunaan, expressivity dan desiderata lainnya. Teori graph tradisional cenderung bekerja dengan model ukuran tetap.  Namun, pertumbuhan web tidak hanya menuntut grafik yang dinamis teori, juga membutuhkan model yang menghormati kualitas pertumbuhan itu. Jadi, misalnya, link baru tidak secara acak, lagi dari link lama kemungkinan adalah bahwa link baru akan tersambung ke halaman yang tersambung sendiri sangat sudah (dengan demikian menampilkan konektivitas preferensial).

4.2 Web matematika
L'opez-Ortiz, dalam survei yang berguna, terlihat di sejumlah paradigma
berguna untuk memahami dasar-dasar algoritmik Internet pada umumnya dan Web pada khususnya. Menerapkan wawasan tentang algoritma masalah jaringan, dalam konteks protokoltertentu mendasari Web, berpotensi sangat bermanfaat. Dan konteks yang sangat penting - fungsi(atau sebaliknya) dari algoritma dalam konteks Web menyediakan beberapa bukti yang palingmeyakinkan bagi mereka yang ingin berpendapat bahwa itu adalah lingkungan yang penting unik.Pertumbuhan dari theWeb, sebagai L'opez-Ortiz menunjukkan, adalah seperti yang paling canggihteks algoritma pengindeksan yang beroperasi baik di dalam zona kenyamanan mereka dalamaplikasi standar pada awal tahun 1995, namun berjuang keras pada akhir tahun itu.

4.2.1 Model Rasional
Salah satu paradigma penting adalah bahwa dari ekonomi mikro, matematika diskrit, 
pilihan rasional teori dan teori permainan. Meskipun pengguna individu  mungkin atau mungkin tidak "rasional", itu telah lama mencatat bahwa secara masal orang berperilaku sebagai maximisers utilitas. Dalam hal ini, pemahaman insentif yang tersedia bagi pengguna Web harus menyediakan metode untuk model menghasilkan perilaku, dan karenanya pandangan tentang apa global set perilaku yang diinginkan bisa direkayasa, dan apa yang bisa sistem mendukung perilaku tersebut. Web tidak memiliki mekanisme koordinasi pusat, namun menghasilkan sistematis perilaku menarik berkat insentif dan kendala dikenakan baik oleh arsitektur, protokol dan standar, dan merekainteraksi dengan sifat sosial atau psikologis dari pengguna atau desainer (Memang, hal ini bisa dibilang fakta bahwa Web dibangun, dikelola dan digunakan oleh banyak pengguna dunia nyata dengan kepentingan hampir terbayangkan beragam dan preferensi yang yang terpenting untuk aplikasi paradigma / ekonomi teori permainan).
Kunci keberhasilan dari Web terletak pada efek jaringan menghubungkan ke sumber daya, jika yang baik memiliki efek jaringan, kemudian nilai itu meningkat baik untuk pemilik individu pemilik semakin banyak adalah, dan semua hal yang sama dengan lebih kaya set link besarnya penggunaan Penyambungan. Jaringan efek dapat berupa langsung atau tidak langsung. A langsungefek adalah di mana permintaan untuk barang dihubungkan dengan jumlah orang yang memilikinya - telepon dan email menjadi contoh utama.
Menafsirkan grafik inWeb istilah ini, 'jaringan ukuran' bisa diberi glos sebagai 'jumlah node dalam webgraph yang' atau 'jumlah link' alternatif. 'Kesediaan untuk membayar' mengacu pada biaya yang pengguna Web adalah siap menyerap. Ini termasuk biaya keuangan rutin seperti menyewa sebuah broadband line, biaya keuangan dimuka seperti pembelian komputer, muka biaya non-keuangan, seperti upaya yang terlibat dalam mendaki kurva belajar yang terkait dengan formalisms tertentu atau aplikasi, dan teratur biaya non-keuangan seperti terus-menerus memastikan bahwa seseorang sistem aman. 'User' itu yang dimaksud juga akan bervariasi: grafikbisa merujuk ke pengguna web biasa (konsumen konten, yang biaya biasanya akan keuangan), tetapi mungkin juga merujuk kepada penulis web (pencipta isi, biaya yang biasanya akan dalam hal waktu dan usaha). Tapi either way, kelanjutan dari efek jaringan yang positif diamati di Web tergantung pada mempertahankan kinerja luar
itu, keseimbangan kedua tidak stabil.
Jaringan efek tidak langsung juga berlaku ke Web. Jaringan tidak langsung efek ditemukandalam industri seperti DVD - saya beli DVD pemain tidak dipengaruhi oleh siapa lagi yangmemiliki satu, tetapi semakin besar jumlah pemilik DVD player, segala sesuatunya sama yanglebih besar dan lebih kaya yang jumlah konten DVD yang tersedia akan (dan memang lebih murahitu akan). Pemodelan efek tidak langsung seperti juga merupakan bagian penting dari memahamibagaimana Web dapat terus berkembang. Bagaimana itu akan mudah untuk menggambarkanWeb dalam permainan teori / rasional pilihan kata? Apakah ada perbedaan intrinsik antara,katakanlah, 'biasa' pengguna dan penyedia layanan? Dan lagi, bagaimana kita memahami, padaparadigma ini, pertumbuhan Web dan invariants dari Web pengalaman? Ini adalah kunci untukpemodelan evolusi pandangan pemain diberikan umpan balik yang mereka terima dari pengalaman. Bagaimana kita menilai tetap titik-titik dalam sistem? Atau membangunkesetimbangan untuk tertentu game setup? Atau mekanisme desain untuk menegakkan "baik"perilaku? Atau model perilaku evolusi kelompok sedemikian sistem skala besar? Mungkin yang paling penting, bagaimana kita melakukan kebalikannya
teori permainan kesetimbangan mengidentifikasi masalah biaya terjangkau dan mekanisme insinyuruntuk mencegah mereka datang tentang?
Jawaban untuk pertanyaan-pertanyaan tersebut muncul pada (setidaknya) dua tingkat.Pertama semua, perilaku pengguna dalam hal (netral-dikandung) tuntutan untuk informasi perludikoordinasikan dalam kemampuan jaringan fisik arus informasi di sepanjang kabel fisik yangsebenarnya. Koordinasi dan routing informasi perlu terjadi tanpa gesekan, dan teori permainanharus nilai dalam pemodelan tersebut. Dan kedua, menafsirkan perilaku pengguna Web harussedemikian rupa sehingga potensi penipuan dan bentuk lain dari perilaku mahal diminimalkan.Tidak ada solusi rekayasa untuk masalah kepercayaan, namun di sisi lain mungkin ada cara-carateknik Web sehingga dapat dipercaya bahwa perilaku bisa adil dihargai tanpa membebankanbiaya terlalu banyak pada pengguna atau mengurangi jumlah interaksi sehingga drastis bahwa efekjaringan menguntungkan diminimalkan.

4.2.2 Informasi pengambilan model
Sebuah paradigma penting kedua adalah bahwa pencarian informasi. IR adalah fokus untuk perlombaan senjata antara algoritma untuk mengekstrak informasi dari repositori yang kedua repositori mendapatkan lebih besar dan lebih kompleks, dan tuntutan pengguna lebih sulit untuk memuaskan (baik dalam hal respon waktu atau kompleksitas dari query). Satu masalah yang jelas berkenaan dengan IR melalui Web adalah bahwa Web tidak memiliki otoritas QA. Siapapun dengan account ISP dapat menempatkan halaman di Web, dan dikenal Web telah menjadi situs proliferasi sebuah teori konspirasi, legenda perkotaan, trivia dan fantasi, serta sebagai penderitaan dari semua gejala informasi unmanaged seperti out-of-date halaman dan duplikasi, semua kesulitan yang berkaitan dengan multimedia representasi, dan semua indeterminacies diperkenalkan oleh  kurangnya ketat terkendala representasi pengetahuan. Memahami persis informasi apa yang tersedia pada halaman yang menunggu untuk diambil tetap menjadi masalah serius. Mungkin lebih tepatnya, IR tradisional telah digunakan di jinak lingkungan di mana massa data ditambang untuk nugget akal; masalah khas adalah kompleksitas dan kurangnya pola.Benchmark koleksi dokumen bagi para peneliti IR cenderung berkualitas tinggi dan hampir tidak pernah sengaja menyesatkan, seperti koleksi karya ilmiah dalam jurnal khusus. Web-lain seperti mini-struktur yang dapat 
digunakan, seperti Intranet, juga ditandai dengan itikad baik dengan informasi yang disajikan. Namun upaya berbahaya untuk menumbangkan sangat IR sistem yang theWeb dukungan baik yang semakin umum. IR berbasis web harus menghadapi tidak hanya skala dan kompleksitasinformasi, tetapi upaya potensi untuk condong hasilnya dengan konten
dimaksudkan untuk menyesatkan.

4.2.3 Struktur berbasis pencarian
Hasil IR yang benar-benar dibawa ke dalam usia pencarian Web adalah penemuan bahwa adalah mungkin untuk membuat perbedaan heuristik antara link tersebut yang muncul untuk menunjukkan kualitas terkait-ke situs, dan mereka yang tidak, hanya berdasarkan perhitungan nilai eigen matriks yang berhubungan dengan struktur link subgraphs lokal. Tak usah dikatakan bahwa apa yang mesin pencari sendiri mencari (di metalevel, sehingga untuk berbicara) adalah kombinasi ajaib presisi tinggi dan recall tinggi - meskipun menentukan recall meliputi penentuan, setidaknya sekitar, jumlah yang relevan halaman di seluruh Web secara keseluruhan, yang perlu untuk mengatakan sebuah terutama keras masalah. Search engine juga harus berjuang untuk tetap saat ini, oleh Mengindeks ulang sesering mungkin, konsisten dengan menekan biaya, sebagai Web tumbuh dan halaman individu diedit atau diubah sebagai database mendasari mereka mengubah.Search engine dapat dibandingkan dengan menggunakan berbagai parameter, baik itu liputan mereka (jumlah hits kembali query yang diberikan, terutama melihat jumlah hits hanya dicapai oleh mesin pencari), relevansi dari halaman kembali; waktu diambil, atau kualitas kembali. Sebagai salah satu harapkan, mesin yang berbeda melakukannya dengan baik pada metrik yang berbeda.

4.2.4 Matematika metode untuk menggambarkan struktur
Memahami matematika dan topologi dari Web adalah praktis impor untuk memahami invariants dari pengalaman Web dan Oleh karena itu menyediakan peta jalan untuk ekstensi untuk theWeb. Yang penting properti yang memiliki Web adalah ketahanan dalam menghadapi meruntuhkan pengaruh; baik hacker maupun kesalahan yang tak terelakkan dalam fisik jaringan sangat mengganggu theWeb, meskipun sesuatu seperti satu router dalam empat puluh turun di setiap saat satu. Para teoritis hasil simulasi komputer kembali empiris menunjukkan bahwa menghapus sampai 80% dari node dari yang besar jaringan skala bebas masih menyisakan cluster dihubungkan kompak. Di sisi lain, teori perkolasi menunjukkan bahwa skala bebas jaringan agak lebih rentan terhadap terarah, serangan terkoordinasi, bahkan jika mereka tahan terhadap kegagalan acak. Non-acak kegagalan bisa merusak jika mereka menargetkan situs yang sangat-tersambung pada khususnya; kegagalan sejumlah kecil hub secara dramatis dapat meningkatkandiameter Web (dalam hal jumlah terkecil klik diperlukan untuk pergi dari satu halaman yang dipilih secara acak lain), dan kegagalan dari sejumlah besar situs yang sangat-terhubung dapat menyebabkan fragmentasi.

4.2.5 Matematika metode untuk menggambarkan layanan
Sebagai Web berkembang untuk memasukkan model layanan, di mana perangkat lunak agen dan layanan Web akan hidup online dan dipanggil oleh pengguna, dan di mana metafora yang semakin penting adalah bahwa klien menghubungi penyedia layanan, representasi matematika baru, formalisms dan teori menjadi berguna untuk menggambarkan hubungan ini. Teori Petri jaring sistem terdistribusi [269, 298] model diskrit, yang Web adalah contoh utama.Teori yang berlaku menambahkan pengertian concurrency dengan ide dari mesin negara, dan telahdisarankan sebagai sarana penting model layanan Web [296]. Proses
aljabar, seperti CSP [141] atau CCS [203] juga dapat model paralel pengolahan. Mereka menyediakan sebuah array konstruksi untuk model dinamika pengolahan informasi dan komunikasi output dan meminta input, seperti kebijakan, urutan tindakan, fungsi pilihan, prosesdan metode sinkronisasi. Salah satu perkembangan terbaru adalah π-kalkulus (bernama analogi ke λ-kalkulus), yang merupakan pengembangan aljabar proses (khusus suatu cabang CCS) dirancang untuk menyediakan mobilitas dalam pemodelan proses. 

No comments:

Post a Comment

Harry Potter - Golden Snitch Angry Birds -  Red Bird