Thursday 19 May 2011

Engineering the Web (Rekayasa Web)

Web Sematik
Web adalah arsitektur berprinsip standar, bahasa dan formalisms yang menyediakan platform untuk aplikasi yang heterogen (banyak). Beberapa tuntutan di web mengharuskan membuat suatu  model yang ekspresif. Sering terjadi bahwa trade off antara expressivity dan kegunaan merupakan akibat dari penyalahgunaan umum dari formalisms tersebut. Desain web semantik terkait formalisms dimaksudkan untuk memperpanjang menutupi data terkait, tidak seperti yang di asumsikan untuk meningkatkan pencarian atau mendapatkan kekuatan yang lebih besar dari teks beranotasi. Ini mungkin sebagai klaim bahwa model lokal dan muncul semantik merupakan bagian penting dari cara kita memahami web. Jika demikian, akan ada trade off yang serius dengan interoperabilitas yaitu manfaat dari pencarian terdistribusi terstruktur dan berbagi data besar namun memerlukan semantik interoperable. Dalam asumsi tertentu bahwa aparat dari web semantik dirancang untuk memperpanjang teknologi yang tersedia untuk melihat dokumen yang menyebabkan kekhawatiran tentang trade off antara mudah semantik muncul atau sulit logika yang salah.

Web Semantik merupakan upaya memperluas potensi web dengan ekstensi analog perilaku manusia. Jadi visi web semantik adalah perluasan dari prinsip-prinsip web dari dokumen untuk data. Data yang akan dibagi akan efektif dan lebih luas. Kekuasaan web akan jauh lebih besar jika data dapat didefinisikan dan terkait sehingga mesin bisa melampaui tampilan dan bukannya mengintegrasikan alasan tentang data berbagai aplikasi. Saat ini web baik teks, musik, gambar, video, dan jasa bisa dengan mudah digunakan pada skala web. Tujuan dari web semantik adalah memfasilitasi menggunakan data serta penemuan mereka, melalui Google dalam hal ini. Secara tradisional, di AI misalnya basis pengetahuan atau sistem pakar atau bahkan database  digunakan untuk mewakili informasi yang handal, dapat dipercaya, mungkin konsisten dan didasarkan pada strategi akusisi terpusat dan representasi protokol. Strategi web semantik untuk menyediakan kerangka kerja umum untuk pembebasan data berdasarkan Deskripsi Resource Framework (RDF), yang mengintegrasikan berbagai aplikasi menggunakan XML sebagai pertukaran sintaks. Web semantik ini tidak hanya masalah menandai dokumen HTML di web, ini berusaha membawa bersama data di seluruh web sehingga membuat luas database melampaui komponennya, yang membuat aplikasi mungkin yang menyimpulkan seluruh data heterogen dan memungkinkan browsing dan kesimpulan di berbagai sumber data kronik.
Web semantik adalah perpanjangan WWW dalam al yang menjadi tahap berikutnya menghubungkan data tidak dokumen. Hal ini dimaksudkan untuk berfungsi dalam konteks model relasional data. Menghubungkan adalah kunci untuk web semantik tersebut. RDF dan OWL memungkinkan pertukaran data dalam konteks dunia nyata.

URI : Nama atau alamat ? atau keduanya ?
Sebuah refrensi URI digunakan sebagai node dalam sebuah grafik RDF mengidentifikasi hubungan antara hal-hal diidentifikasi oleh node terhubung. Secara umum menggunakan URI untuk mengidentifikasi sumber daya merupakan faktor penting dalam pengembangan web. URI memliki lingkup global dan diinterpretasikan secara konsisten di seluruh konteks. Hubungan diidentifikasi dengan URI, link sumber daya juga diidentifikasi oleh URI. Untuk mendapatkan mesin pembacaan yang dimaksudkan web semantik aman, maka mesin harus bisa mendapatkan hubungan dan harus dapat deference URI yang mengidentifikasi relasi dan mengambil sebuah reprentasi dari sumber daya diidentifikasi. Biasanya nama dan alamat berbeda. Nama merujuk langsung ke sesuatu. Alamat yang mengatakan dimana anda. Dalam komputer tradisional pengidentifikasian muncul dalam bahasa pemrograman. Alamat adalah lokasi di memori. Nama yang dipakukan ke objek, alamat ke tempat-tempat, dan karena itu objek harus memiliki satu nama selamanya, sementara alamatnya bisa berubah.

3.1.6 Metadata
Isuisu yang berkaitan dengan semantik atau penafsiran Web melampaui Semantic Web. Sebagai contoh, metadata dapat digunakan untuk menggambarkan atau membubuhi keterangan sumber daya dalam rangka untuk membuatnya (lebih) dimengerti untuk pengguna. Pengguna ini mungkin menjadi manusia, dalam hal metadata dapat menjadi tidak terstruktur, atau mesin, dalam hal metadata harus mesin dibaca. Biasanya, metadata adalah deskriptif, termasuk misalnya elemen dasar sebagai nama penulis, judul atau abstrak dokumen, dan administrasi informasi seperti jenis file, hak akses, menyatakan HKI, tanggal, nomor versi dan sebagainya. Item multimedia dapat dijelaskan dengan deskripsi tekstual konten, atau kata-kata kunci untuk membantu berbasis teks pencarian. Secara umum, metadata yang penting untuk pencarian yang efektif (mereka membiarkan sumber daya yang ditemukanoleh berbagai kriteria, dan sangat membantu dalam menambah struktur dicari sumber daya non-teks), pengorganisasian sumber daya (misalnya, memungkinkan portal untukberkumpul komposit laman web secara otomatis dari sumber daya yang sesuai beranotasi beberapa), pengarsipan bimbingan, dan informasi mengidentifikasi (seperti nomor referensi yang unik, yang membantu memecahkan masalah satu ketika Sumber daya Web adalah 'sama'seperti yang lain). Mungkin penggunaan paling penting untuk metadata adalah untuk mempromosikan interoperabilitas, memungkkinkan kombinasi sumber daya heterogen di seluruh platform tanpa kehilangan konten. Skema Metadata memfasilitasi pembuatan metadatadalam standar format, untuk memaksimalkan interoperabilitas.

3.2 Referensi dan identitas
Semantic Web mengandalkan konvensi penamaan dengan URI, dan Tentu saja setiap bagian dari sistem pelabelan Web yang bergantung pada beberapa konvensi atau lainnya. Masalah dengan label di Web adalah bahwa sistem apapun dasarnya desentralisasi dan tidak diawasi, sesuai dengan Web yang mengatur prinsip-prinsip, tetapi ini tidak sentralisasi memungkinkan skema yang berbeda dan konvensi, dan memang kecerobohan, untuk berkembang, yang pada gilirannya membuka kemungkinan kegagalan referensi unik.

3.2.1 Referensi: Kapan dua benda yang sama?
Desentralisasi adalah masalah dari sudut pandang logis, meskipun besar keuntungan dari yang pencipta konten. Kegagalan referensi unik relatif sepele bagi pengguna manusia untuk menguraikan, tetapi tentu saja sangat sulit bagi mesin untuk bekerja keluar. Dan
jika kita berharap untuk mengekstrak informasi yang berguna dari repositori yang sangat besar informasi, dimana kerajinan tangan solusi dan referensi memeriksa oleh mata tidak layak, pengolahan mesin tidak bisa dihindari. Referensi masalah yang sangat mungkin terjadi ketika sumber-sumber informasi digabung, masalah di mana-mana tapi yang serius dalam konteks dari Web Semantic. Dan desentralisasi Web menghalangi membuat asumsi nama yang unik, dalam cara. Di sisi lain, URI menyediakan Web dengan sumber daya untuk menghindari setidaknya beberapa masalah grounding tradisional, ketika dapat diatasi bahwa dua istilah ini menunjuk ke URI yang sama.

3.2.2 Kapan dua halaman yang sama?
Alternatif mengambil masalah referensi adalah bahwa penentuan ketika dua halaman web adalah halaman yang sama. Hal ini tentu saja akan menjadi sepele dalam banyak kasus, tetapi sering kali "utama " teks yang disalin dari satu halaman ke lain, tetapi dikelilingi oleh iklan yang berbeda, logo, header dan footer. Banyak metrik yang tersedia yang dimaksudkan untuk menentukan kuantitatif tingkat hubungan antara dua halaman. Kesamaan penilaian bisa sembarangan dan pragmatis, tergantung pada konteks (misalnya memutuskan plagiat atau kasus pelanggaran hak cipta), tetapi teknik dari teori informasi yang ada untuk menghasilkan set nomor tujuan untuk memberi makan ke dalam proses penilaian - misalnya, Levenshtein edit jarak, dan varian algoritma, diberikan dengan jumlah minimum operasi dari beberapa basis yang diperlukan untuk bisa mengubah satu string menjadi lain.

3.3.3 Personalisasi
Hal ini sering mengklaim bahwa personalisasi itu penting untuk meningkatkan 
nilai dari suatu jaringan, dan meningkatkan konsumen lock-in. Mengizinkan pengguna untuk menyesuaikan alat-alat mereka dan berarti ruang kerja yang Web tetap lebih dari commoditised satu ukuran cocok untuk semua daerah dan  malah menjadi sebuah ruang di mana orang dapat mengukir sendiri niche. Selain itu, mereka juga harus dapat menerima layanan yang lebih baik, disesuaikan dengan keadaan khusus mereka sendiri dan preferensi, 
untuk sama atau hanya sedikit lebih biaya. sistem industri tersebut adalah  jelas aplikasi teknologi. Untuk mendapatkan personalisasi yang efektif, harus ada pemanfaatan yang terintegrasi dari informasi dari sejumlah sumber, termasuk data tentang pengguna (clickstream data, download pola, profil online), sumber daya yang  dikirim (konten situs, struktur situs) dan pengetahuan domain, bersama-sama dengan data teknis pertambangan yang cukup untuk menciptakan pandangan holistik dari sumber daya yang meliputi sebanyak mungkin informasi yang dibutuhkan pengguna, dalam representasi yang akan masuk akal bagi mereka, sementara tidak termasuk informasi  mereka tidak akan mau, dan yang bisa memperhitungkan dinamika  sifat model pengguna. Semua itu, sambil tetap mempertahankan hubungan antara invariants dari pengalaman Web dan konteks tertentu penggunaan seseorang yang memberdayakan dia untuk klaim sudut dari dunia maya dan mulai menggunakannya sebagai perpanjangan dari ruang pribadi. Mengingat bahwa, di Web, informasi yang relevan mungkin sangat didistribusikan dan dinamis, personalisasi diharapkan dapat menjadi salah satu besar keuntungan dari Web Semantic, yang unggul struktur yang memungkinkan penalaran atas sumber data dan didistribusikan. Ada banyak program teknik berjalan menyelidiki heuristik untuk personalisasi dari informasi yang tersedia, termasuk 
menggunakan mesin belajar, ontologi, jaringan P2P, dan menghasilkan representasi untuk memfasilitasi pengumpulan informasi pengguna, serta menyediakan lingkungan yang memfasilitasi personalisasi dan link asosiatif didasarkan pada user-bukan dari penulis-preferensi. Lain benang penting dari personalisasi rekayasa adalah pengembangan alat untuk memungkinkan neophytes relatif untuk menciptakan atau meningkatkan pengetahuan teknik artefak kompleks, seperti ontologi atau pembungkus. 


3.3.4 Multimedia
Web adalah lingkungan multimedia, yang membuat untuk kompleks semantik - ini tentu saja tidak masalah yang unik ke Web. Metareasoning dan epistemologi sering menganggap media tekstual, bahkan meskipun sebenarnya banyak penalaran dalam bentuk analog. Misalnya ahli sering menggunakan diagram untuk mengekspresikan pengetahuan mereka. Ada memiliki upaya telah menghasilkan taksonomi generatif 'bahasa-seperti' 
representasi visual, tetapi ini tidak tampaknya telah menarik aplikasi. Pendekatan kata kunci mungkin goyah dalam multimedia konteks karena kekayaan yang lebih besar dari banyak non-tekstual Media.
Pendekatan gambar Google pencarian bergantung pada sekitarnya teks untuk gambar, misalnya, yang memungkinkan pencarian yang relatif cepat, dan sekali lagi pada umumnyapengguna seringkali mampu membuat pilihan final memilah-milah rekomendasi yang disampaikan. Kehadiran manusia dalam loop sulit untuk menghindari saat ini.
Sebagai hybrid menarik telah disarankan bahwa kesenjangan semantik bisa diisi denganontologi dari visual yang mencakup istilah tingkat rendah dan memberikan semacam pemetaankonsep-konsep abstrak ke tingkat yang lebih tinggi disajikan dalam query dan metadata. Infrastruktur tersebut telah telah dibuat, dengan menggunakan (i) ontologi descriptor visualberdasarkan RDF representasi dari MPEG-7 deskripsi visual, (ii) struktur multimedia ontologiberdasarkan skema deskripsi-7 multimedia MPEG dan (iii) pemodelan ontologi inti primitif padaakar konsep hierarki yang dimaksudkan untuk bertindak sebagai jembatan antara ontologi, semuaditambah dengan ontologi domain [260]. A penting yang lebih jauh terbuka adalah isuinteroperabilitas teknologi Semantic Web dengan non-RDF berbasis metadata seperti metadataEXIF di file JPEG atau tag gambar informal dibuat di Flickr. Pekerjaan lebih lanjut diperlukanpada hubungan antara kebutuhan manusia dan sistem temu kembali citra kemungkinan otomatisasi[156, 206], termasuk pemahaman yang lebih dalam dari kemampuan relatif folksonomi danontologi. Tentu saja, media di sini tergambar adalah foto dan video; terbuka pertanyaan penelitiantetap tidak hanya tentang seberapa jauh orang bisa masuk pencarian dengan pendekatan semacam, tetapi juga tentang berapa banyak media akan menyerah sedemikian pendekatandengan cara yang terintegrasikan.

3.3.5 Pemrosesan Bahasa Alam
Akhirnya, ada masalah substansial yang berkaitan dengan pengolahan bahasa alami
(NLP), analisis komputasi data tidak terstruktur dalam teks-teks untuk menghasilkan pemahaman mesin (pada tingkat tertentu) dari teks.  Di tempat pertama, alam bahasa adalah domain yang sangat jarang, dalam kalimat yang paling diucapkan atau tertulis hanya sekali atau sangat jarang, dan skala raksasa. NLP memiliki potensi besar untuk pembangunan jenis-jenis antarmuka intuitif bahwa heterogen dan belum tentu computerliterateWeb komunitas pengguna membutuhkan.
Dari sudut pandang Web Sains, pertanyaan terbuka yang penting ada untuk hubungan antara NLP dan Web, adalah statistik teknik yang digunakan dalam NLP atau sebaliknya melengkapi logis dan semantis berdasarkan teknik interogasi data yang digunakan oleh
SW masyarakat. Jika kita memahami SemanticWeb sebagai fokus pada data dan model database relasional, maka logis syarat dan URI gigihmenjadi pusat. NLP bekerja dengan baik statistik, SW, sebaliknya, membutuhkan logika dan belum menggunakan substansial statistic. Bahasa alami demokratis, seperti yang diungkapkan dalam slogan 'artinya adalah  menggunakan'). Setara dalam SW kata-kata bahasa alami adalah istilah-istilah logis yang  menonjol. Demikian kita memiliki disanalogy langsung antaraNLP dan SW, yang URI, tidak seperti kata-kata, mempunyai pemilik, dan sehingga dapat diatur.

No comments:

Post a Comment

Harry Potter - Golden Snitch Angry Birds -  Red Bird