A Keyword Retrieval Semantics over Relational Databases
Essay by randadiputra • December 11, 2016 • Research Paper • 2,127 Words (9 Pages) • 2,087 Views
Sebuah Semantik Katakunci Pencarian lebih Relasional Database
Dong Xie, Jin-Ling Luo, Yan Zhu
Department Ilmu Komputer dan Teknologi Manusi Institut Humanities, Sains dan Teknologi
Lou’di China
Departmen Elektronik dan Teknik Informatika
Lou’di Vokasional dan Universitas Teknikal
Lou’di China
Abstrak
Cara saat ini dapat mengembalikan hasil pencarian dalam menanggapi set universal, tetapi subset non-null memiliki lebih redundansi sebagai set hasil. Makalah ini menyajikan seluruh semantik untuk mengambil database relasional dengan kata kunci, menstandarkan kata kunci pencarian untuk semantik. Cara mempekerjakan angka pengambilan yang berbeda untuk mencetak kata kunci untuk kata kunci yang berbeda. Berbagai jenis algoritma pencarian yang diusulkan berdasarkan fokus pengambilan untuk menghasilkan set tuple terkait, yang ditransformasikan ke kalimat pengambilan SQL untuk mengembalikan semua hasil query untuk pengguna. Percobaan menunjukkan bahwa cara dengan fokus pengambilan menghindari redundansi data dengan baik.
© 2012 Di publikasikan leh Elsevier B.V. Seleksi dan/atau kajian dibawSeah tanggunjawab Garry Lee
Keyword: Relational database, pencarian katakunci, fokus pencarian
- Pendahuluan
Data struktural sistem database relasional untuk mendapatkan hasil tertentu dan lengkap dengan kalimat-kalimat kompleks. Sistem informasi pengambilan permintaan data non-struktural untuk mendapatkan pasti dan tidak lengkap hasil dengan pengambilan kata kunci, mereka beberapa hasil yang lebih relevan daripada yang lain. Beberapa RDBMSs pasokan pencarian teks untuk membangun indeks teks lengkap, ini membentuk dasar untuk pengambilan kata kunci dari database relasional (KRORD).
KRORD adalah untuk menemukan relevansi antara tupel dengan kata kunci dalam database relasional. Dalam sistem saat ini (BANK [1] !DBXplorer [2] !DISCOVER [3] !IR-Style [4] !EKSO [5] ObjectRank [6] !SEEKER [7] metode pemodelan menggunakan skema grafik dan grafik data. Nodes dari grafik skema sesuai dengan tupel tabel relasional, tepi menunjukkan hubungan referensi antara tupel. Nodes dari grafik data yang sesuai dengan hubungan database, tepi menunjukkan kendala antara definisi skema. sistem ini dibagi menjadi jenis online dan offline berdasarkan metode pemodelan. sistem online mengungkapkan database sebagai skema grafik untuk mendapatkan hasil yang konsisten terbaru dalam database dengan SQL, tetapi kecepatan lambat. sistem secara offline mengungkapkan database sebagai data grafik untuk mengeksekusi algoritma permintaan cepat diperluas, menggunakan preprocessing untuk menghasilkan h data untuk meningkatkan kecepatan query.
Jika hasil set berisi semua kata kunci, ini dapat menyebabkan masalah non-hasil, sistem saat menyelesaikan masalah. Namun, subset non-null harus memiliki redundansi besar sebagai hasil set. Dalam query top-k, itu sulit bahwa tingkat presisi dan tingkat recall memiliki keseimbangan yang baik. Makalah ini membuat set hasil tidak semua subset non-null untuk menyelesaikan data yang redundansi data, perisai bersatu masalah tentang pengambilan yang scoring data atribut numerik dan teks data atribut.
- Analisa Sintaks
Sebuah database DB dengan relasi n (R1,R2,…,Rn) setiap relasi R mengandung atribut m, yaitu, R (AT1, AT2, ..., ATM), di mana beberapa atribut merupakan kunci primer (PK) atau kunci asing (FK). PKI merupakan identifikasi unik dari Ri, FKj ?? Rj, PKI-FKj hubungan antara Ri dan Rj (l (Ri, Rj)). Semua linkes membentuk skema relasi set (reset) Nama ulang (l1, l2, ...). Dalam skema relasi set, ada hubungan antara dua relasi umumnya. Sebuah query kata kunci Q berisi serangkaian kata kunci (kw1, KW2, ...) yaitu Q (kw1, KW2, ...).
A adalah untuk berbagai jenis kata kunci diidentifikasi dengan menganalisa sintaks query untuk cara karyawan yang berbeda. Contoh "kertas dari Jim Gray setelah tahun 1990 tentang Transaksi", Pencari menunjukkan sebagai "Jim Gray Transaksi Tahun:> = 1990" .Ini adalah sulit untuk diidentifikasi dan ditangani untuk "Jim Gray Transaksi". menganalisis sintaks perlu mengidentifikasi beberapa situasi: (1) tiga kata kunci yaitu "Jim", "Gray", "Transaksi"; (2) dua kata kunci yaitu "Jim", "Gray Transaksi"; (3) kata kunci yaitu "Jim Gray Transaksi"; (4) dua kata kunci yaitu "Jim Gray", "Transaksi" .suatu permintaan dari pengguna yang keempat dalam praktis.
Untuk data dalam database relasional pencarian, makalah ini meningkatkan sintaks Pencari. Sintaks baru mempertahankan pengambilan data saat ini untuk atribut teks dan menyadari pengambilan data untuk metadata dan atribut numerik, sehingga desain pekerjaan "+" dan "-" operasi untuk pengambilan kunci, ini berarti bahwa semantik pengambilan disajikan oleh dua operasi antara kata kunci yang berbeda sedangkan pengguna komit kata kunci.
(1) kata kunci. Hal ini digunakan untuk query data atribut teks. Jika ada beberapa kata kunci kelas pertama, mereka harus dipisahkan oleh "+"; sama, jika pengguna tidak perlu kata kunci kelas tertentu, mereka harus dipisahkan oleh "-". Bahkan jika kata kunci memiliki dua kata, cara membantu pengguna untuk mengekspresikan permintaan permintaan akurat dan menghilangkan ketidakjelasan efektif.
(2) katakunci 2. Ini pertanyaan metadata untuk atribut teks. Sejak "Jim Gray" mungkin di "Penulis" atribut atau hubungan lain, query pencarian "Jim Gray" dan "Penulis: Jim Gray", mungkin menghasilkan hasil yang berbeda set. Menggunakan sintaks kedua harus membatasi ruang lingkup pencarian dalam hubungan atau atribut sehubungan dengan "Author", ini mengurangi ketidakjelasan kalimat pencarian dan mengontrol ruang lingkup pencarian secara efektif. "Katakunci1" mengungkapkan hubungan atau atribut, "keyword2" mengungkapkan nilai hubungan atau atribut. Jika ada beberapa kata kunci kelas kedua, mereka harus dipisahkan oleh "+"; sama, jika pengguna tidak perlu kata kunci kelas dua tertentu, mereka harus dipisahkan oleh "-".
(3) kata kunci 3 Hal ini digunakan untuk secara tepat permintaan atribut numerik. Dalam kata kunci kelas tiga, porsi sebelum ¢ op² mengungkapkan hubungan atau atribut, ¢ op² adalah operator relasional (=> <== <> <>), Nilai mengungkapkan nilai atribut.
Menurut di atas, query "kertas dari Jim Gray tentang Transaksi tetapi tidak ada tentang database setelah 2000 "mungkin dinyatakan sebagai" Penulis: Jim Gray + tahun => 2002 + Judul: Transaksi-Judul: database ". Pengguna mengirimkan kalimat pencarian yang mengandung tiga kelas, yang ditangani oleh sistem pencarian.
Definisi 1. Seluruh Semantik (PS). Jika kata kunci dinyatakan sebagai Qi + Qj-Qk, semantik kalimat pengambilan dapat dinyatakan oleh Qi + Qj-Qk-Qi'-Qj ', di mana Qi' dan Qj 'adalah pertanyaan tanpa kata kunci dalam Qi dan Qj. Jadi semantik dinyatakan sebagai Seluruh semantik.
Semantik standardisasi menangani setiap kata kunci, sehingga kunci global harus diidentifikasi danterurai dengan kata kunci independen tunggal dan kelas mereka, yang dicetak oleh pengambilan pencetak gol yang berbeda. Algoritma relatif adalah sebagai berikut:
...
...