第一篇:空間數(shù)據(jù)庫知識點總結
空間數(shù)據(jù)庫知識點總結
1、數(shù)據(jù):指客觀事物的屬性、數(shù)量、位置、及其相互關系等的符號描述。
2、信息:是數(shù)據(jù)的內(nèi)容,信息=數(shù)據(jù)+數(shù)據(jù)處理
3、空間數(shù)據(jù):是對空間事物的描述,實質(zhì)上是指以地球表面空間位置為參照,用來描述空間實體的位置、形狀、大小及其分布特征諸多方面信息的數(shù)據(jù)。是帶有空間坐標的數(shù)據(jù),包括文字、數(shù)字、圖形、影像、聲音等多種方式。
4、數(shù)據(jù)庫:長期儲存在計算機內(nèi)的、有組織、可共享的數(shù)據(jù)集合。
5、空間數(shù)據(jù)庫是指描述與特定空間位置有關的真實世界對象的數(shù)據(jù)集合。
6、空間數(shù)據(jù)類型:地圖數(shù)據(jù)、影像數(shù)據(jù)、地形數(shù)據(jù)、屬性數(shù)據(jù)
7、空間數(shù)據(jù)特征:時空特征、多維特征、多尺度性、海量數(shù)據(jù)特征
8、空間數(shù)據(jù)庫的作用:①空間數(shù)據(jù)處理與更新②海量數(shù)據(jù)存儲與管理③空間分析與決策④空間信息交換與共享。
9、空間數(shù)據(jù)管理模式現(xiàn)狀(五種方式):文件管理方式、文件與關系數(shù)據(jù)庫混合型空間數(shù)據(jù)庫、全關系型空間數(shù)據(jù)庫、對象-關系型空間數(shù)據(jù)庫和面向?qū)ο罂臻g數(shù)據(jù)庫。
10、空間數(shù)據(jù)模型現(xiàn)狀(三維數(shù)據(jù)結構分類):基于體描述的和基于面表示的數(shù)據(jù)模型及三維矢量、柵格、混合與面向?qū)ο蟮臄?shù)據(jù)結構。
11、與傳統(tǒng)數(shù)據(jù)庫的差異:①信息描述差異②數(shù)據(jù)管理差異③數(shù)據(jù)操作差異④數(shù)據(jù)更新差異⑤服務應用差異。
12、空間認知:是對現(xiàn)實世界的空間屬性包括位置、大小、距離、方向、形狀、模式、運動和物體內(nèi)部關系的認知,是通過獲取、處理、存儲、傳遞和解譯空間信息,來獲取空間知識的過程。
13、空間類型表現(xiàn)形式:①感知空間②認知空間③符號空間④物理空間⑤感覺運動空間。
14、空間認知模式:①空間特征感知:空間特征感知發(fā)生于感知空間;②空間對象認知:空間對象認知發(fā)生于認知空間;③空間格局認知:空間格局認知發(fā)生于符號空間。
15、現(xiàn)實世界認知過程:現(xiàn)實世界(是存在于人們頭腦之外的客觀世界)觀察抽象為概念世界(是現(xiàn)實世界在人們頭腦的反應)在經(jīng)過定義編碼模型化為數(shù)字世界(是概念世界中的信息數(shù)據(jù)化)。
16、空間認知三層模型:①空間概念數(shù)據(jù)模型:是關于實體與實體間聯(lián)系的抽象概念集,有矢量數(shù)據(jù)模型、柵格數(shù)據(jù)模型,矢量-柵格一體化數(shù)據(jù)模型②空間邏輯數(shù)據(jù)模型:表達概念模型忠數(shù)據(jù)實體及其間關系,常用的有層次模型、網(wǎng)絡模型和關系模型③物理數(shù)據(jù)模型:描述數(shù)據(jù)在計算機中的物理組織、存儲路徑和數(shù)據(jù)庫結構。
17、空間實體:空間數(shù)據(jù)中不可再分的最小單元現(xiàn)象。分為點實體(表示零維空間實體)、線實體(表示一維空間實體)、面實體(表示二維空間實體)、體實體(表示三維空間實體)。
18、矢量數(shù)據(jù)描述特點:矢量方法強調(diào)離散現(xiàn)象的存在,把現(xiàn)實世界的空間實體抽象地看作是由平面上的點、線、面三種基本空間目標組成。①點:由一對地理坐標定義,可以用來代表位置信息。②線:用一連串有序的兩個或多個坐標對點集合來表達對于本身寬度在研究中可以忽略的線狀空間對象。③面:對于面狀區(qū)域則是通過對邊界線的定義來進行的。
19、矢量數(shù)據(jù)的結構主要有spaghetti結構(ESRI公司的shapefile格式)和拓撲矢量數(shù)據(jù)結構。
20、拓撲矢量數(shù)據(jù)結構:最基本的拓撲關系有:關聯(lián)、鄰接、包含。拓撲關系表示為:結點拓撲關系、線拓撲關系、多邊形拓撲關系。
21、柵格數(shù)據(jù)取值方法:中心歸屬法、面積占優(yōu)法、長度占優(yōu)法、重要性法。
22、柵格數(shù)據(jù)存儲方法:全柵格式存儲、鏈式編碼、行程編碼、塊式編碼、四叉樹編碼。
23、空間關系:空間目標之間在一定區(qū)域上構成的與空間特性有關的聯(lián)系,分為:拓撲關系、度量關系、順序關系。拓撲關系指:拓撲變化下的拓撲變量,如空間目標關聯(lián)、相鄰與連通關系;度量關系指:用某種度量空間中的度量來描述的目標間的關系,如長度、大小、面積、體積;方位關系用來描述目標在空間中整體和局部的某種順序關系,如前后、上下、左右等。
24、Geodatabase空間對象模型基本元素:對象類、要素類、要素數(shù)據(jù)集、關系類、幾何網(wǎng)絡類、Domains、Validation Rules、Raster Dataset、TIN Dataset。
25、TIN模型:由不規(guī)則分布的數(shù)據(jù)點連成的三角網(wǎng)組成,是一種基于三角形的空間鑲嵌模型,三角形的形狀和大小取決于不規(guī)則的觀測點或稱結點的密度和位置。
26、LOP優(yōu)化原則:運用Delaunay三角網(wǎng)的性質(zhì)對由兩個有一公共邊的三角形組成的四邊形進行判斷。
27、TIN生成的算法:逐點插入法、分治算法、三角形生長法。
28、Grid(規(guī)則格網(wǎng))模型:每個網(wǎng)格的數(shù)值有兩種解釋:網(wǎng)格柵格觀點(網(wǎng)格單元的數(shù)值是其所有點的高程值)、點柵格觀點(網(wǎng)格單元的數(shù)值是網(wǎng)格中心點的高程或平均高程值)。
29、三維空間構模方法:面模型(不規(guī)則三角網(wǎng)、網(wǎng)格、線框)、體模型(三棱柱、廣義三棱柱、八叉樹)、混合模型。
30、四面體網(wǎng)格:是將目標空間用緊密排列單不重疊的不規(guī)則四面體形成的網(wǎng)格來表示,其實質(zhì)是2D TIN結構在3D空間上的擴展。
31、文件系統(tǒng)中,數(shù)據(jù)按其組成分為:數(shù)據(jù)項、記錄、文件。
32、空間數(shù)據(jù)庫系統(tǒng):帶有數(shù)據(jù)庫的計算機系統(tǒng),采用現(xiàn)代數(shù)據(jù)庫技術來管理空間數(shù)據(jù)。
33、空間數(shù)據(jù)引擎:是用來解決如何在關系數(shù)據(jù)庫中存儲空間數(shù)據(jù),實現(xiàn)真正的數(shù)據(jù)庫方式管理空間數(shù)據(jù),建立空間數(shù)據(jù)服務器的方法。
34、空間數(shù)據(jù)引擎作用:①與空間數(shù)據(jù)庫聯(lián)合,為用戶提供空間數(shù)據(jù)服務;②提供開放的數(shù)據(jù)訪問;③SDE對于外提供了空間幾何對象模型。④快速的數(shù)據(jù)提取和分析;⑤SDE提供了連接DBMS數(shù)據(jù)庫的借口。⑥與空間數(shù)據(jù)庫聯(lián)合可以管理海量空間信息。⑦無縫的數(shù)據(jù)管理,實現(xiàn)空間數(shù)據(jù)與屬性數(shù)據(jù)統(tǒng)一存儲。⑧并發(fā)訪問。
35、空間數(shù)據(jù)引擎實例:mapinfo公司的spatialWare、arcgis空間數(shù)據(jù)引擎、supermap的XDSE。
36、ArcSDE的主要功能:高性能的DBMS通道;開放的DBMS支持;多用戶;GIS工作流和長事務處理;豐富的地理信息數(shù)據(jù)模型;連續(xù)、可伸縮的數(shù)據(jù)庫;靈活的配置。
37、空間數(shù)據(jù)組織:縱向分層組織、橫向分塊組織。
38、空間索引:在存儲空間數(shù)據(jù)時,依據(jù)空間對象的位置和形狀或空間對象之間的某種空間關系,按一定順序排列的一種數(shù)據(jù)結構,包含空間對象的概要信息。
39、空間索引分類:樹結構、線性映射、多維空間區(qū)域變換。從應用范圍可分為動態(tài)索引和靜態(tài)索引。典型空間索引技術包括R樹索引、四叉樹索引、網(wǎng)絡索引 40、R樹索引是一種高效的空間索引,是B樹在多維空間的擴展,也是平衡樹。采用空間聚集的方式把相鄰近的空間實體劃分到一起,組成更高一級的結點。
41、R樹索引的特點:典型的R樹索引每個結點所對應的存儲空間和外存頁面或其整數(shù)倍想對應,以此提高結點從外存到內(nèi)存的交換效率。
42、R+樹:是兄弟區(qū)域之間沒有重疊的索引方法。特點:兄弟結點對應的空間區(qū)域沒有重疊,使空間搜索效率提高。根結點至少有兩個子結點;所有葉結點在同一層;葉結點中數(shù)據(jù)矩形允許并可能重疊。
43、SQL語言:標準的數(shù)據(jù)庫查詢語言,用于關系數(shù)據(jù)庫管理系統(tǒng)的一種常見商業(yè)查詢語言,是目前關系數(shù)據(jù)庫管理系統(tǒng)領域的主流查詢語言。功能:查詢、操縱、定義、控制。
44、關系模型的擴展:突破關系模型中關系、允許定義層次關系和嵌套關系;增加抽象數(shù)據(jù)類型;增加空間謂詞;增加適合于空間數(shù)據(jù)索引的方法。
45、關系模型擴展的優(yōu)勢:可以用統(tǒng)一的DBMS管理圖形和屬性數(shù)據(jù);圖形數(shù)據(jù)管理也可以享用DBMS在數(shù)據(jù)管理方面帶來的優(yōu)越性;圖形數(shù)據(jù)的關系化表達,使其能享用客戶機/服務器的優(yōu)勢。
46、空間選擇查詢:在地圖上劃出一個區(qū)域,查詢該區(qū)域內(nèi)所有空間數(shù)據(jù)。包括點查詢、區(qū)域查詢、最鄰近查詢。
47、空間查詢步驟:過濾篩選步驟、細化步驟。
48、執(zhí)行查詢分析的類型:屬性查詢、空間查詢、空間分析。
49、元數(shù)據(jù):數(shù)據(jù)的數(shù)據(jù)。提供關于空間數(shù)據(jù)的信息,是關于數(shù)據(jù)和信息資源的描述信息。
50、空間元數(shù)據(jù):各類空間數(shù)據(jù)描述的集合。描述地理信息數(shù)據(jù)集內(nèi)容、表示、空間參考、質(zhì)量以及管理的數(shù)據(jù)。
51、數(shù)據(jù)字典:描述數(shù)據(jù)集中的部分內(nèi)容。
52、空間數(shù)據(jù)交換:將一種數(shù)據(jù)格式轉(zhuǎn)換為另外某種數(shù)據(jù)格式的技術。轉(zhuǎn)換內(nèi)容包括:空間定位信息、空間關系信息、屬性信息。
53、空間數(shù)據(jù)交換方式:外部數(shù)據(jù)交換模式、直接數(shù)據(jù)訪問模式、基于空間數(shù)據(jù)轉(zhuǎn)換標準的轉(zhuǎn)換、空間數(shù)據(jù)互操作模式。
54、空間數(shù)據(jù)庫設計原則:①空間數(shù)據(jù)庫設計與應用系統(tǒng)設計相結合的原則;②數(shù)據(jù)獨立性原則;③共享度高、冗余度低原則;④用戶與系統(tǒng)的接口簡單性原則;⑤系統(tǒng)可靠性、安全性與完整性原則;⑥系統(tǒng)具有重新組織、可修改與可擴充性原則。
55、空間數(shù)據(jù)庫設計過程:需求分析、概念設計、邏輯設計、物理設計、數(shù)據(jù)庫的實現(xiàn)、數(shù)據(jù)庫運行和維護。
第二篇:空間數(shù)據(jù)庫總結
第一章:
1.簡述空間數(shù)據(jù)的結構特點及用傳統(tǒng)商用關系數(shù)據(jù)庫管理空間數(shù)據(jù)的局限性:
答:1.結構特點:(1)從數(shù)據(jù)組織和管理角度看,空間數(shù)據(jù)與一般的事務數(shù)據(jù)相比具有非結構化特征(2)相對于一般的事務數(shù)據(jù)而言,空間數(shù)據(jù)量大(3)用以描述事物或現(xiàn)象隨時間的變化2.局限性:(1)表示某種空間對象實體記錄的空間字段難于預先確定(2)空間信息有坐標系統(tǒng)(3)關系數(shù)據(jù)原有的功能不能滿足地理空間應用要求
2.空間數(shù)據(jù)管理的演化過程
答:1.人工管理階段(20世紀50年代中期)特點:(1)數(shù)據(jù)不保存(2)沒有數(shù)據(jù)管理軟件
(3)數(shù)據(jù)冗余2.文件系統(tǒng)階段(20世紀60年代中期)特點:(1)數(shù)據(jù)文件是大量數(shù)據(jù)的集合形式(2)面向用戶的數(shù)據(jù)文件(3)數(shù)據(jù)文件與對應的程序具有一定的獨立性(4)由初期的順序文件發(fā)展為索引文件、鏈接文件、直接文件等3.文件與數(shù)據(jù)庫系統(tǒng)混合管理系統(tǒng)(20世紀80年代初期)特點:(1)對用戶觀點的數(shù)據(jù)進行嚴格細致的描述(2)允許用戶以記錄或數(shù)據(jù)項作單位進行訪問(3)數(shù)據(jù)的物理存儲可以很復雜,同樣的物理數(shù)據(jù)可以導出多個不同的邏輯文件4.全關系型空間數(shù)據(jù)庫管理系統(tǒng)(20世紀80年代后期);5.對象關系數(shù)據(jù)庫管理系統(tǒng);6.面向?qū)ο蟮臄?shù)據(jù)庫系統(tǒng)
3..空間數(shù)據(jù)庫的研究內(nèi)容:
答:1.地理空間數(shù)據(jù)的獲取與處理:(1)空間數(shù)據(jù)庫的準確性研究;(2)空間數(shù)據(jù)質(zhì)量研究;
2.地理空間數(shù)據(jù)組織(1)空間數(shù)據(jù)的多種表達方式研究;(2)時空關系的研究;(3)海量空間數(shù)據(jù)庫的結構體系研究3.地理空間數(shù)據(jù)庫系統(tǒng):(1)空間關系語言研究(2)分布處理和Client/Server模式4.地理空間數(shù)據(jù)共享的研究
4.松散雙元空間數(shù)據(jù)管理的結構及其弊端
文件與數(shù)據(jù)庫系統(tǒng)混合管理系統(tǒng)(20世紀80年代初期)特點:(1)對用戶觀點的數(shù)據(jù)進行嚴格細致的描述(2)允許用戶以記錄或數(shù)據(jù)項作單位進行訪問(3)數(shù)據(jù)的物理存儲可以很復雜,同樣的物理數(shù)據(jù)可以導出多個不同的邏輯文件
答:
第二章:
1.基于實體空間對象描述的基本特點:
答:基于對象的模型強調(diào)個體現(xiàn)象,對象之間的空間位置關系通過所謂拓撲關系進行連接,主要描述不連續(xù)的地理現(xiàn)象,適合表示有固定形狀的空間實體
2.基于場模型地理空間描述適應的地理變量的分布特點:
答:分布特點:在一定空間內(nèi)連續(xù)分布。將地理空間的事物和現(xiàn)象作為連續(xù)的變量來看待。基于場模型可分為:圖斑模型、等值線模型、選擇模型
3.柵格數(shù)據(jù)操作的基本類型:
答(1)局部操作;(2)聚焦操作;(3)區(qū)域操作;(4)全局操作(5)圖像操作
4.矢量數(shù)據(jù)向柵格數(shù)據(jù)轉(zhuǎn)移的基本算法
答:(1)內(nèi)部點擴散算法(2)復數(shù)積分算法(3)射線算法的掃描算法(4)邊界代數(shù)算法
5.矢量數(shù)據(jù)與柵格數(shù)據(jù)結構的區(qū)別:
答:(1)柵格數(shù)據(jù)結構具有“屬性明顯,位置隱含”的特點,它易于實現(xiàn),操作簡單,有利于柵格的空間信息模型的分析,但柵格數(shù)據(jù)表達精度不高,數(shù)據(jù)存儲量大,工作效率低;(2)矢量數(shù)據(jù)結構具有“位置明顯,屬性隱含”的特點,它操作起來比較復雜,許多分析操作(如疊置分析)用矢量數(shù)據(jù)結構難于實現(xiàn);但它的數(shù)據(jù)表達精度高,數(shù)據(jù)存儲量小,工作效率高。
6.非拓撲辯狀矢量層文件數(shù)據(jù)組織與拓撲矢量文件數(shù)據(jù)組織的區(qū)別:
答: 非拓撲辮狀矢量層文件的數(shù)據(jù)組織,它僅記錄空間目標位置坐標和屬性信息,而不記錄它的拓撲關系,它可能有兩種形式,一種是:每個點線面坐標直接跟隨它的空間坐標;另
一種方式是:點坐標作為一個文件,線和多邊形有點號組成。在非拓撲數(shù)據(jù)組織中,邊界線數(shù)據(jù)均獲取和存儲兩次,這就會產(chǎn)生裂隙或重疊,并產(chǎn)生數(shù)據(jù)冗余;為了消除裂隙,一般需要編輯。拓撲矢量層文件數(shù)據(jù)組織,實際上還僅僅是結點線面之間的關聯(lián)拓撲關系,這種關系通常有兩種表達關系:全顯示表達和半隱含表達,全顯示的表達是指結點弧段面塊相互之間的所有關聯(lián)拓撲關系,都用關系表顯示的表達出來,關系除了要明確表示出來從上到下的拓撲關系,還要用關系表列出結點弧段面塊之間的關系,但任然沒有包括點與面,面與點的關聯(lián)關系,這種關系是以弧段為橋梁建立的;半隱含表達則是用弧段—結點—弧段—面塊的表格表示幾何目標間的拓撲關系,建立空間目標之間的拓撲關系,這樣一來修改面塊—弧段的拓撲關系時,邊界上內(nèi)點移動只需進行一次,且只需修改弧段坐標數(shù)據(jù)文件即可,可以方便的實現(xiàn)數(shù)據(jù)共享問題。
7.簡述線狀網(wǎng)絡數(shù)據(jù)模型設計的主要幾何對象,并說明其文件組織的基本思想
答:形狀網(wǎng)絡模型主要幾何要素:結點,幾何弧段,邏輯弧段;文件分為結點文件,弧段坐標文件、拓撲關系文件、邏輯網(wǎng)段文件。結點文件記錄坐標、關聯(lián)邊、結點其他屬性;弧段坐標文件記錄弧度中間點坐標拓撲關系文件記錄起、終點坐標、坐標指針、其他屬性;邏輯網(wǎng)段文件記錄網(wǎng)段中邏輯關系;結點文件中坐標決定拓撲文件中起、終點,結點中的關聯(lián)邊、弧段坐標文件、拓撲關系文件中坐標指針構成邏輯網(wǎng)段文件。
8.簡述基于polyvert的多邊形網(wǎng)絡拓撲數(shù)據(jù)結構的基本思想
答:polyvert包括結點文件、弧段中間坐標文件,多邊形文件、拓撲文件、拓撲索引文件。結點、弧度中間坐標文件記錄坐標;多邊形文件記錄多邊形弧段序列指針;拓撲文件包括弧段標志號,中間點坐標個數(shù)及其指針,起、終點,左、右多邊形;拓撲索引文件記錄地址指針。多邊形文件通過拓撲索引文件與拓撲文件相關聯(lián);拓撲文件通過中間點坐標指針與弧段中間坐標文件相結合,通過起、終點與結點文件相結合。
第四章:
1.簡述數(shù)據(jù)的邏輯層次單位和物理層次單位,并給出邏輯記錄與物理記錄的定義:
答:(1)邏輯層次單位:數(shù)據(jù)項、記錄、文件、數(shù)據(jù)庫、數(shù)據(jù)倉庫;物理層次單位:bit、字節(jié)、字、塊;(2)邏輯記錄:
2.試述邏輯記錄的物理組織形式與各自的特點:
答:(1)定長記錄固定組塊:實現(xiàn)簡單,只須說明塊的體積和記錄的長度(2)變長記錄不跨界組塊:把不同長度的記錄存放到一個塊中,要識別它們就必須給個記錄時加一個長度指示器PR(3)變長記錄跨界組塊:一個記錄在意個塊中存放不下時,可以跨過邊界存到另一個塊中;(4)塊列:將若干個數(shù)據(jù)塊組成一個塊列,文件系統(tǒng)的軟件一次讀/寫整個塊列,記錄可跨越塊的邊界,但不允許跨越塊列的邊界。
3.在Hash文件組織中,何為碰撞?何為數(shù)據(jù)溢出?并說明處理桶數(shù)據(jù)溢出需用的方法 答(1)
5.空間索引的定義。它與傳統(tǒng)文件索引有何不同。對空間數(shù)據(jù)建立空間索引的目的答(1)空間索引:指依據(jù)空間對象的位置和形狀或空間對象之間的某種空間關系,按一定順序排列的一種數(shù)據(jù)結構(2)不同:
6.空間數(shù)據(jù)庫的靜態(tài)索引和動態(tài)索引有何不同,二者具有哪些優(yōu)缺點。
答:(1)靜態(tài)索引是通過建立空間數(shù)據(jù)庫中的邏輯記錄與物理記錄之間的靜態(tài)索引表,使用各種查找算法,查找表結構,從而實現(xiàn)數(shù)據(jù)文件的索引。靜態(tài)索引的實現(xiàn)比較簡單,但修改很不方便,難以實現(xiàn)對數(shù)據(jù)文件實時的增加或刪除(2)動態(tài)索引是在數(shù)據(jù)操作的過程中動態(tài)生成的索引結構。使用動態(tài)索引方法可以很方便地實現(xiàn)數(shù)據(jù)文件實時改動,但索引結構的實現(xiàn)復雜,維護索引結構需要計算時間和空間。
7.從技術層面上,空間索引分為哪幾種形式,并說明每種形式各自特點:
答:(1)對象影射技術:該方法將K維對象轉(zhuǎn)移成2K維空間上的點(2)對象復制和裁剪技術:將空間劃分為不相交的子空間,并依據(jù)子空間的劃分,將落在多個子空間的對象劃分多個組成部分(3)重疊子空間方法:將地圖劃分為可以重疊的子空間,以便每個對象完全落在一個子空間。
8.簡述格網(wǎng)空間索引實施的基本原理。傳統(tǒng)格網(wǎng)索引與改進格網(wǎng)索引的區(qū)別:
答:網(wǎng)格空間索引基本原理是:將研究區(qū)域用橫豎線條劃分大致相等和不等的網(wǎng)絡,記錄每一個個網(wǎng)所包含的空間實體,當用戶進行空間查詢時,首先計算出用戶查詢對象所在的格網(wǎng),然后再在該格網(wǎng)中快速查詢所選空間實體。這樣一來,就大大的加速了空間對象的查詢速度。區(qū)別:傳統(tǒng)式一維,改進是二維
第五章:
1.在面向?qū)ο罂臻g數(shù)據(jù)模型中,地理要素的幾何抽象類型有哪些形式(拓撲形式與非拓撲形式兩種分析)
答:(1)拓撲形式:結點、弧段、多邊形、多面體
(2)非拓撲形式:點、線、面、表面、體
2.何為空間數(shù)據(jù)層的工作區(qū)?并簡述工作區(qū)的無縫數(shù)據(jù)庫與有縫數(shù)據(jù)庫的各自特點。
答:(1)工作區(qū):為了使計算機能夠識別和處理地理要素,必須將連續(xù)地現(xiàn)實世界中地理實體及相互關系進行離散和抽象,建立若干以地理區(qū)域為界的認識地理空間的窗口。(2)無縫數(shù)據(jù)庫:有統(tǒng)一的坐標系、無縫隙、不受傳統(tǒng)圖幅劃分的限制,整個工作區(qū)域在數(shù)據(jù)庫中相當于一個整體;有縫數(shù)據(jù)庫:采用分塊存儲管理和處理,以數(shù)據(jù)塊作為基本單位,一個數(shù)據(jù)塊構成一個數(shù)據(jù)存儲單位。
3.在考慮了空間數(shù)據(jù)庫的分層及分塊情況下,空間物體關系對象有哪幾種形式?每一種形式主要表示何種空間關系?
答(1)結點和弧段之間的網(wǎng)絡關系,弧段和多邊形之間的多邊形關系。數(shù)據(jù)塊之間的相同空間物體連接關系、要素層之間的相關地理要素連接關系。
5.Coverage矢量數(shù)據(jù)模型的優(yōu)缺點?
答:1.優(yōu)點:(1)空間數(shù)據(jù)與屬性數(shù)據(jù)相結點;(2)能夠存儲矢量要素之間的拓撲關系2.缺點:(1)空間數(shù)據(jù)不能很多的與其行為相對應;(2)以文件方式保存空間數(shù)據(jù),而將屬性數(shù)據(jù)存放在另外的DBMS中;(3)Coverage模型拓撲結構不夠靈活,局部變動后則必須對全局的拓撲關系重新建立;(4)在不同的Coverage之間無法建立拓撲關系。
6.Geodatabase數(shù)據(jù)模型結構主要涉及到哪些基本組成要素?這種數(shù)據(jù)模型具有哪些特點? 答:(1)基本組成要素:要素類、要素數(shù)據(jù)集、關系類、幾何網(wǎng)絡、域、有效規(guī)則、柵格數(shù)
1在同一數(shù)據(jù)庫中統(tǒng)一地管理各種類型的空間數(shù)據(jù);據(jù)集、TIN datasets、定位器(2)特點:○
2.空間數(shù)據(jù)的錄入和編輯更加準確;3.空間數(shù)據(jù)更加面向?qū)嶋H的應用領域;4.可以表達空間○○○
5.可以更好的進行制圖;6.空間數(shù)據(jù)的表示更為準確;7可以管理連續(xù)的數(shù)據(jù)的相互關系;○○○
8支持空間數(shù)據(jù)的版本管理和多用戶并發(fā)操作 空間數(shù)據(jù),無需分塊、分幅;○
第六章:
1.空間數(shù)據(jù)庫的內(nèi)容組成答:從應用性質(zhì)上空間數(shù)據(jù)庫可分為基礎地理空間數(shù)據(jù)庫和專題數(shù)據(jù)庫?;A地理空間數(shù)據(jù)庫包括基礎地形要素矢量數(shù)據(jù)(DLG)數(shù)字高程模型(DEM)、數(shù)字正射影像(DOM)、數(shù)字柵格地圖(DRG)以及相應的元數(shù)據(jù)庫(MD)。專題數(shù)據(jù)庫(TD)包括土地利用書記、地籍數(shù)據(jù)、規(guī)劃管理數(shù)據(jù)、道路數(shù)據(jù)等。
2.何為數(shù)據(jù)庫的三級模式與兩級映射?數(shù)據(jù)定義語言的作用及形式
答:1.三級模式:外模式(子模式或用戶模式)、模式(概念模式或邏輯模式)、內(nèi)模式(存
儲模式);兩級映射:子模式/模式映射、模式/存儲模式映射;2.作用:定義數(shù)據(jù)的各種特征:形式:(1)模式DDL—定義數(shù)據(jù)庫的全局邏輯結構;(2)子模式DDL—定義view(視圖);
(3)DML—數(shù)據(jù)處理;(4)物理DDL—定義數(shù)據(jù)的物理存儲方式。
3.基于文件系統(tǒng)的空間數(shù)據(jù)庫體系結構:
答:1.文件組織:(1)定長記錄(2)變長記錄(3)聚蔟文件組織;2.空間數(shù)據(jù)引擎:基于特定的空間數(shù)據(jù)模型,在特定的數(shù)據(jù)存儲、管理系統(tǒng)的基礎上提供對空間的存儲、檢索等操作,以提供在此基礎上的二次開發(fā)3.緩沖區(qū)管理:
4.基于數(shù)據(jù)庫管理主流的空間數(shù)據(jù)庫混合體系結構:
文件與數(shù)據(jù)庫系統(tǒng)混合管理系統(tǒng)(20世紀80年代初期)特點:(1)對用戶觀點的數(shù)據(jù)進行嚴格細致的描述(2)允許用戶以記錄或數(shù)據(jù)項作單位進行訪問(3)數(shù)據(jù)的物理存儲可以很復雜,同樣的物理數(shù)據(jù)可以導出多個不同的邏輯文件
5.分步式空間數(shù)據(jù)庫的模式結構?并說明其全局用戶視圖,全局概念模式,局部內(nèi)容與數(shù)據(jù)庫的三級模式有何區(qū)別?在該模式的結構中,分布式空間數(shù)據(jù)庫管理系統(tǒng)與局部空間數(shù)據(jù)庫管理系統(tǒng)起的作用有何不同?實現(xiàn)多空間數(shù)據(jù)庫集成需要解決的主要問題是什么?
分步式空間數(shù)據(jù)庫的模式結構是:模式結構總體可以分為兩部分,一是集中式空間數(shù)據(jù)庫的模式,代表了各場地上參與空間數(shù)據(jù)庫系統(tǒng)的基本結構;二是,分布式空間數(shù)據(jù)庫系統(tǒng)增加的模式。
區(qū)別:一個分布式空間數(shù)據(jù)庫是由若干個已經(jīng)存在的相關空間數(shù)據(jù)庫集成的,全局用戶視圖,全局概念模式,局部內(nèi)容是針對于一個分布式空間數(shù)據(jù)庫而言的。數(shù)據(jù)庫的三級模式是針對于一個空間數(shù)據(jù)庫而言的,全局用戶視圖相當于數(shù)據(jù)庫的外模式,全局概念模式相當于數(shù)據(jù)庫的模式,局部內(nèi)容相當于數(shù)據(jù)庫的內(nèi)模式。
在該模式的結構中,對于用戶來說,在分布式空間數(shù)據(jù)庫管理系統(tǒng)中,智能進行基礎的操作,而不能定義自己的視圖,而在局部空間數(shù)據(jù)庫管理系統(tǒng)中用戶卻可以定義自己的視圖。實現(xiàn)多空間數(shù)據(jù)庫集成需要解決的主要問題:一:選擇全局統(tǒng)一的空間數(shù)據(jù)庫模型來描述全局概念模式和分片模式;二:選擇全局統(tǒng)一的空間查詢語言作為全局系統(tǒng)和用戶交互界面;三:解決分片的異構性,實現(xiàn)局部概念模式到全局分片模式的轉(zhuǎn)換,即異構同化;四:解決分片沖突問題,構造全局的概念模式,即同構整體化。
第三篇:2012年空間數(shù)據(jù)庫實習總結
空間數(shù)據(jù)庫實習總結
經(jīng)過對空間數(shù)據(jù)庫的課堂教學的學習,我們對空間數(shù)據(jù)庫的建立有了理論上的基礎,于十八周進行了空間數(shù)據(jù)庫的課程設計實習。
此次實習主要在計算機上實現(xiàn),在ArcCatalog和ArcGIS軟件平臺上進行。旨在讓學生在已基本掌握各種空間數(shù)據(jù)庫的存貯和管理技術的基礎上,進行空間數(shù)據(jù)維護和管理的訓練,在GIS原理、空間數(shù)據(jù)庫理論、常用軟件功能和相關專業(yè)知識之間建立起聯(lián)系,培養(yǎng)學生具有編寫實習報告的能力。
本實習可加深學生對各種空間數(shù)據(jù)庫的原理和方法的理解,為后續(xù)的GIS軟件設計課程及GIS科學研究打下良好的基礎。
在獨立完成《地理信息系統(tǒng)實習教程》第八篇“空間數(shù)據(jù)維護與管理”的所有練習后,我們基本上對拓撲規(guī)則有一定了解,對建立拓撲關系和應用拓撲關系對數(shù)據(jù)質(zhì)量的檢驗的操作方法也有一定了解;對建立Geodatabase數(shù)據(jù)庫,將CAD的DWG文件轉(zhuǎn)換成可以被ArcGIS接受的線要素等,進而轉(zhuǎn)換成多邊形,再生成網(wǎng)格;具體操作了投影變換、坐標變換的練習,進行了坐標轉(zhuǎn)換、左邊拉伸、接邊、影像配準等等操作;還進行了對數(shù)據(jù)源和元數(shù)據(jù)的學習??在此基礎上我們可以建立基本的數(shù)據(jù)庫Geodatabase。
最后,進行了 “重慶交通大學空間數(shù)據(jù)庫” 設計,由于缺乏基本數(shù)據(jù),所以此次“重慶交通大學空間數(shù)據(jù)庫”的設計只有基本的思路設計,即需求分析,概念設計(概念模型的建立,即“實體—關系”模型即E-R模型的建立),邏輯設計(邏輯數(shù)據(jù)模型即關系模型的建立),物理設計(物理數(shù)據(jù)模型的建立)。
在此次實習過程中,
第四篇:空間數(shù)據(jù)庫復習題
Chapter 1: Introduction to Spatial Databases
1、舉例說明什么是空間數(shù)據(jù)、非空間數(shù)據(jù)?如何理解空間查詢(spatial queries)和非空間查詢的區(qū)別(Non-spatial queries)?
答:河流的泛洪區(qū),衛(wèi)星影像數(shù)據(jù)、氣象氣候數(shù)據(jù)等都可以是空間數(shù)據(jù)
書店名稱 店員人數(shù),去年的銷售量,電話號碼等是非空間數(shù)據(jù)
空間查詢是對空間數(shù)據(jù)的查詢或命令
2、什么是GIS,什么是SDBMS?請闡述二者的區(qū)別和聯(lián)系。
答:
1、GIS是一個利用空間分析功能進行可視化和空間數(shù)據(jù)分析的軟件。它的主要功能有:搜索、定位分析、地形分析、流分析、分布、空間分析/統(tǒng)計、度量
GIS 可以利用SDBMS來存儲、搜索、查詢、分享大量的空間數(shù)據(jù)集
2、SDBMS是一個軟件模塊。它可以
①、利用一個底層的數(shù)據(jù)庫管理系統(tǒng)
②、支持多種空間數(shù)據(jù)模型、相應的空間抽象數(shù)據(jù)類型(ADT)以及一種能夠調(diào)用這些ADT的查詢語言
③、支持空間索引、高效的空間操作算法以及用于查詢優(yōu)化的特定領域規(guī)則
3、區(qū)別與聯(lián)系:①、利用GIS可以對某些對象和圖層進行操作,而利用SDBMS則可以對更多的對象集和圖層進行更加簡單的操作
②、SDBMS可以在GIS不能使用的某些領域進行使用,例如基因組學、天文學、多媒體信息系統(tǒng)等
③、GIS可以作為SDBMS的前端,利用一個高效的SDBMS可以大大提高GIS的效率和生產(chǎn)率。
3、從GIS這一縮寫的三種含義來理解GIS的發(fā)展歷程。答:地理信息系統(tǒng):為專業(yè)人員提供的軟件
地理信息科學:為地理信息系統(tǒng)和服務提供使用和發(fā)展的定義、框架和理論 地理信息服務:為普通用戶提供的網(wǎng)點和服務中心,例如PC機上的地理和空間服務
4、用傳統(tǒng)數(shù)據(jù)庫系統(tǒng)管理空間數(shù)據(jù),存在什么不足之處?
答:1)無法用遞歸和嵌套的方式來描述復雜關系的層次和網(wǎng)狀結構,模擬和操作復雜地理對象的能力較弱;
2)用關系模型描述本身具有復雜結構和涵義的地理對象時,需對地理實體進行不自然的分解,導致存儲模式、查詢途徑及操作等方面均顯得語義不甚合理;
3)由于概念模式和存儲模式的相互獨立性,及實現(xiàn)關系之間的聯(lián)系需要執(zhí)行系統(tǒng)開銷較大的聯(lián)接操作,運行效率不夠高
4)空間數(shù)據(jù)通常是變長的,而一般RDBMS只允許記錄的長度設定為固定長度,此外,通用DBMS難于存儲和維護空間數(shù)據(jù)的拓撲關系。
5)一般RDBMS都難以實現(xiàn)對空間數(shù)據(jù)的關聯(lián)、連通、包含、疊加等基本操作。
6)一般DBMS不能支持GIS需要的一些復雜圖形功能。
7)一般RDBMS難以支持復雜的地理信息,因為單個地理實體的表達需要多個文件、多條記錄,包括大地網(wǎng)、特征坐標、拓撲關系、屬性數(shù)據(jù)和非空間專題屬性等方面信息。
8)GIS管理的是具有高度內(nèi)部聯(lián)系的數(shù)據(jù),為了保證地理數(shù)據(jù)庫的完整性,需要復雜的安全維護系統(tǒng),而這些完整性約束條件必須與空間數(shù)據(jù)一起存儲,由地理數(shù)據(jù)庫來維護系統(tǒng)數(shù)據(jù)的完整性。否則,一條記錄的改變會導致錯誤、相互矛盾的數(shù)據(jù)存在,而一般RDBMS難以實現(xiàn)這一功能。
5、What is a SDBMS ?
答:SDBMS是一個軟件模塊。它可以
①、利用一個底層的數(shù)據(jù)庫管理系統(tǒng)
②、支持多種空間數(shù)據(jù)模型、相應的空間抽象數(shù)據(jù)類型(ADT)以及一種能夠調(diào)用這些ADT的查詢語言
③、支持空間索引、高效的空間操作算法以及用于查詢優(yōu)化的特定領域規(guī)則
6、什么是后關系數(shù)據(jù)庫模型?后關系數(shù)據(jù)庫模型有哪些?
答:后關系數(shù)據(jù)庫模型支持用戶定義抽象數(shù)據(jù)類型,空間數(shù)據(jù)的類型可以添加。
包括面向?qū)ο蟮臄?shù)據(jù)庫模式OOBDMS和面向關系ORDBMS的數(shù)據(jù)庫模式。
7、SDBMS的三層體系結構(Three Layer Architecture)是什么?借此深入理解SDBMS的作用。
答:空間應用—空間數(shù)據(jù)庫—DBMS
教材P11的圖
8、空間數(shù)據(jù)庫主要涉及哪些內(nèi)容?
答:數(shù)據(jù)模型、查詢語句、查詢處理與優(yōu)化、文件組織和索引、數(shù)據(jù)挖掘
9、舉例說明單遍掃描查詢和多遍掃描查詢的概念。
答:單邊掃描查詢中,被查詢的表(關系)中的一條記錄(元組)最多只被訪問一次;例如“列出武大周圍5km內(nèi)的書店的名字”。
多遍掃描查詢是被查詢的表(關系)中的一條記錄(元組)至少被訪問一次,例如“找出其代表的選取范圍大于200公頃并且在這區(qū)擁有公司的女議員的名字”
10、過濾-精煉策略的作用?兩個步驟的內(nèi)容是什么?
提示:ppt : Efficient algorithms to answer spatial queries Common Strategyfast but content is lost when power is off主存:速度快,信息斷電丟失 Secondary storage-slower, retains content without power二級存儲器:慢,信息斷電不丟 Tertiary storage(如磁帶驅(qū)動器)-very slow, retains content, very large capacity脫機存儲器:非常慢,保存信息容量非常大。DBMS usually manage data
? ? ? on secondary storage, e.g.disks Use main memory to improve performance User tertiary storage(e.g.tapes)for backup備份, archival檔案 etc.4、磁盤存儲相關概念:磁道track、扇區(qū)sector、柱面cylinder?頁面的概念? 答:磁道:圓心磁盤片上向邊緣延伸的同心圓
扇區(qū):每個磁道中被分成若干等份的區(qū)域 柱面:是磁盤上具有相同鐳的磁道的集合
頁面:又稱磁盤塊。是磁盤與主存之間的最小傳輸單位
5、訪問磁盤扇區(qū)數(shù)據(jù)的過程,哪個過程花費的時間最多? 提示:ppt: Accessing a sector has three major steps: ? ? ? Seek(尋道): Move head assembly to relevant track(ts)磁頭到達特定磁道所用的時間
Latency(延遲時間): Wait for spindle to rotate relevant sector under disk head(tl)塊旋轉(zhuǎn)到磁頭下方所用的時間 ? Transfer傳輸時間: Read or write the sector(tt)置于正確位置后讀寫塊中數(shù)據(jù)的實際時間 ? 1>2>3
6、如何有效利用磁盤硬件?
提示:ppt : Using Disk Hardware Efficiently
? Size of sectors扇區(qū)面積
? ? ? ? Larger sector provide faster transfer of large data sets 數(shù)據(jù)集大時大扇區(qū)提供更快的傳輸速度
But waste storage space inside sectors for small data sets 但浪費了小數(shù)據(jù)集的存儲空間
? Placement of most frequently accessed data items放置頻繁使用的數(shù)據(jù)
? ? ? On middle tracks rather than innermost or outermost tracks 在中間的磁道而不是最里面或最外面的磁道
Reason: minimize average seek time可以減少尋道時間
Placement of items in a large data set requiring many sectors放置一個需要很多扇區(qū)的大數(shù)據(jù)集
? ? Choose sectors from a single cylinder盡量放在同一個柱面
Reason: Minimize seek cost in scanning the entire data set.減少掃描全集花費的時間
7、域(filed)、記錄(record)、文件(file)的概念,提示: Mapping Records and files to Disk.? Records ? ?
? Often smaller than a sector Many records in a sector Files with many records文件是記錄的集合
? Many sectors per file
8、頁面的概念:磁盤與主存之間的最小傳輸單位。一個文件可能跨越多個頁面。一個頁面是槽的集合,一個槽包含一條記錄
9、文件結構的含義,舉例說明幾種常用文件結構—heap,Ordered、Hashed、Clustered。答:文件結構是指文件中記錄的組織形式。
堆:無序文件。記錄沒有特定的順序。,根據(jù)給定的關鍵碼(如name)查找一條記錄需要掃描文件中的記錄。在最壞情況下,文件的所有記錄都要被檢查,所有存儲該文件數(shù)據(jù)的磁盤
頁面都要被訪問。平均來說,需要檢索一半的磁盤頁面。優(yōu)點是在進行插入操作時可以很容易地在文件末尾插入一條新記錄。存儲河流表
散列文件:使用散列函數(shù)吧記錄分到一系列散列單元中??扇≈幵谟谒軌虬褦?shù)量大致相同的記錄放入每個散列單元中。對于點查詢、插入、刪除都很有效。不適合范圍查詢。按字符個數(shù)存儲城市名稱。
有序文件:根據(jù)給定的主碼與對記錄進行組織。折半法非常有效。不能直接運用在空間領域例如,除非對多維空間中的點定義一個全序,否則無法對城市的位置排序。有序文件組織方式還可以根據(jù)對空間數(shù)據(jù)集的文件組織方式而概括成空間聚類。
聚類:聚類的目的就是降低響應常見的大查詢的尋道時間(ts)和等待時間(t1)。對于空間數(shù)據(jù)庫來說,這意味著在二級存儲中,空間上相鄰的和查詢上有關聯(lián)性的對象在物理上應當存儲在一起。
10、使用空間填充曲線組織空間數(shù)據(jù)的意義?
提示:Chapter 1,Organizing spatial data with space filling curves
? ? ? ?
11、掌握Z-曲線、hilbert曲線的生成。(要求給IJ號,能夠?qū)懗鰧猌碼和Hilbert碼的計Impose an ordering on the locations in a multi-dimensional space 加強了多維空間中的位置排序
Allow use of traditional efficient search methods on spatial data 允許在空間數(shù)據(jù)中使用傳統(tǒng)的有效搜索
算過程)
12、基于Z-曲線,如何進行區(qū)域匹配的?(匹配有效性?)
答:用z1和z2分別代表兩個z值,其中z1是較短的一個,并未失去一般性;對于相應的區(qū)域(比如塊)r1和r2,只有兩種可能:1)如果z1是z2的前綴(例如,z1=l***,z2=11**或z1=*l**,z2=11**),則r1完全包含r2;2)兩個區(qū)域不相交(例如,z1=*0**,z2=11**)。
13、什么是索引?索引文件的內(nèi)容。主索引和二級索引。A table can have at most one primary index.Why? 答:索引文件是用來提高數(shù)據(jù)文件查詢效率的輔助文件。記錄的只有碼值和數(shù)據(jù)文件中的頁
面地址。索引記錄被排序,數(shù)據(jù)文件本身可以是不按關鍵碼排序。
主索引,如果數(shù)據(jù)文件的記錄是按照主碼排列的,那么索引就只需要保存數(shù)據(jù)文件的每個磁盤頁面第一個主碼域值。每個索引記錄一個數(shù)據(jù)頁面。
二級索引:堆數(shù)據(jù)文件,一個索引記錄一個數(shù)據(jù)。
一個磁盤最多只有一個主索引,因為主索引決定了數(shù)據(jù)在磁盤上的存儲順序。
14、什么是空間索引?有哪些空間索引方法?
答:空間索引結構用一組桶(通常對應二級存儲的頁面)來組織對象。
空間索引呢就是依據(jù)空間對象的位置和形狀或空間對象之間的某種空間關系按一定的順序排列的一種數(shù)據(jù)結構,其中包含空間對象的概要信息,如對象的標識、外接矩形及指向空間對象實體的指針。
方法:1)在系統(tǒng)中加入專門的外部空間數(shù)據(jù)結構,為空間屬性提供如同B樹之于線性屬性的功能。
2)使用空間填充曲線(如Z序、Hilbert曲線)將空間對象映射到一維空間,以便空間對象存儲在標準的一維索引(例如B樹)中。
15、網(wǎng)格文件包含哪兩部分內(nèi)容?建立格網(wǎng)索引的思路和步驟?了解R樹索引和R+樹索引的思想?
答:包含n維網(wǎng)格目錄,目錄只能夠的每一項指向一個數(shù)據(jù)桶。第二部分是由稱為線性比例的一維數(shù)組組成的結構。
思路:是將研究區(qū)域用橫豎線條劃分大小相等或不等的格網(wǎng),記錄每一個格網(wǎng)所包含的空間實體。當用戶進行空間查詢時,首先計算出用戶查詢對象所在格網(wǎng),然后再在該網(wǎng)格中快速查詢所選空間實體,這樣一來就大大地加速了空間索引的查詢速度。
步驟:
劃分行列(M X N);
計算網(wǎng)格大小及每個格網(wǎng)的矩形范圍;
開辟目標空間(記錄目標穿過的網(wǎng)格)和格網(wǎng)空間(記錄格網(wǎng)內(nèi)的目標); 注冊點、線、面、注記等目標,并記錄之;
提取窗口所覆蓋的目標關鍵字(采用數(shù)據(jù)位方法,以降低排序時間,及避免數(shù)據(jù)的繪制順序等);
提取目標所涉及的網(wǎng)格。
Chapter5 Query Processing and Optimization
1、從查詢處理的角度來看,空間數(shù)據(jù)庫與關系數(shù)據(jù)庫之間有哪些主要區(qū)別?
答:至少有三個主要區(qū)別:①、與關系數(shù)據(jù)庫不同,空間數(shù)據(jù)庫沒有固定的運算符集合可以充當查詢計算的基本構件
②、空間數(shù)據(jù)庫要處理非常大量的復雜對象,這些對象具有空間范圍,不能自然的排列成一維數(shù)組。
③、檢測空間謂語要用到計算量極大的算法,所以不能再假定I/O代價在CPU的處理代價中只能主導地位
2、空間查詢的基本構件有哪些?
提示:ppt5.1.2 Choice of building blocks,List of building blocks Point Query,Range Query,Spatial Join,Nearest Neighbor; 點查詢:給定一個查詢點P,找出所有包含它的空間對象O 范圍或區(qū)域查詢:給定一個查詢多邊形P,找出所有與之相交的空間對象O 空間鏈接:兩個表R和S基于一個空間謂語θ進行連接時,該連接成為空間連接。最近鄰居:空間聚集,即給定一個對象O,找出所有距離O最近的對象P
3、空間查詢處理的“過濾-精煉模式”是什么,其目的?(對象操作的兩步查詢處理)目的:用兩步算法高效地處理復雜的數(shù)據(jù)類型
過濾:尋找Q最終結果的超集S;精煉:利用GIS處理S來找到精確的Q的答案
4、空間查詢處理中,一般是采用什么(MBR))來替代不同類型的空間實體(如線、面)?這樣做有何好處?
提示:Ppt:Approximating spatial data types Minimum orthogonal bounding rectangle(MOBR or MBR)最小外接矩形 approximates line string, polygon, …近似的線串,多邊形 See Examples below(Black rectangle are MBRs for red objects)
MBRs are used by spatial indexes, e.g.R-treeM Algorithms for spatial operations MBRs are simple空間操作MRS的算法很簡單
5、舉例說明SDBMS是如何利用空間實體的MBRs來加快處理速度的? Ppt:Approximate Spatial Operations
6、對于點查詢、區(qū)域查詢、空間連接查詢操作,各自有哪些處理算法(策略)?它們與什么因素有關?
提示:Strategies for Point Queries,Strategies for Range Queries,Strategies for Spatial Joins 與包含待查詢的關系的文件的組織方式有關。
答:點查詢:數(shù)據(jù)未排列且沒有索引:窮舉法,掃描整個文件并判斷每條記錄是否滿足謂語
建立空間索引:在索引中使用find操作;需要查找的磁盤扇區(qū)等于索引的深度
空間填充曲線散列:運用折半法尋找點;檢驗大約logB(n),的磁盤扇區(qū)
區(qū)域查詢:數(shù)據(jù)未排列且沒有索引:窮舉法,掃描整個文件并判斷每條記錄是否滿足謂語
建立空間索引:在索引中使用范圍查詢操作
空間填充曲線散列:驗證Z值滿足范圍查詢要求;使用折半查詢找到最低的Z值;掃描前面的數(shù)據(jù)文件直至滿足查詢要求的最大的Z值 空間連接:嵌套循環(huán),檢驗所有可能的空間謂語對;
基于空間分塊,只檢驗普通空間區(qū)域的對象對 樹匹配:從每張表中找出分層的的對象組
7、什么是查詢優(yōu)化器?查詢優(yōu)化器所承擔的主要任務是什么?
答:查詢優(yōu)化器是數(shù)據(jù)庫軟件中的一個模塊,它用于產(chǎn)生不同計算計劃并確定適當?shù)膱?zhí)行策略。主要任務:邏輯轉(zhuǎn)換、動態(tài)規(guī)劃。
8、查詢語言與查詢樹之間的互換? 語法分析器執(zhí)行
9、對查詢樹進行邏輯轉(zhuǎn)換的目的和一般方法是什么? 答:方法:將非空間的選擇和投影操作下推
目的:減少連接操作所涉及的關系大小,從而減少計算代價。
10、Distributed Environments的概念?在分布式環(huán)境下,空間數(shù)據(jù)庫系統(tǒng)面臨哪些挑戰(zhàn)? 提示ppt:New issues for SDBMS)
答:自治異質(zhì)計算機的集合,通過網(wǎng)絡連接,服務器框架:服務器提供定義明確的服務,用戶使用服務。
挑戰(zhàn):概念模型上:不同種類模式之間的轉(zhuǎn)換
邏輯模式上:在其他SDBMS上命名、查詢表;其他SDBMS上的表要復制原始表
查詢過程與優(yōu)化:通過網(wǎng)路的數(shù)據(jù)傳輸代價將會主導CPU和I/O代價,需要新的策略來控制數(shù)據(jù)的傳輸成本。
11、舉例說明分布式空間數(shù)據(jù)庫的半連接操作。(書上P161)答:1)只將連接屬性和主碼從站點1發(fā)送到站點2 2)只將有關元組從站點2發(fā)送到站點1.12、了解基于Web的空間數(shù)據(jù)庫系統(tǒng)的體系結構。(書上P162)
Chapter 6: Spatial Networks
1、舉例理解空間網(wǎng)絡、空間網(wǎng)絡查詢。鐵路網(wǎng)絡、密西西比河河網(wǎng),查詢YW線沿途車站數(shù)量,最后一個車站,密西西比河的支流名稱
2、圖及其相關概念。
答:一個圖G=(V,E)是由一個有限頂點集V頂點之間的邊集E組成的。邊集E頂點集V的一個二元關系。
如果構成邊集的各個頂點對是有序的,那么圖G就是有向的(directed);否則該圖是無向的(undirected)。
頂點和邊有時也分別稱為結點(node)和鏈接(1ink)。
有序頂點對的第一個頂點稱為前驅(qū)(predecessor)或者源(source),第二個頂點稱為后繼(successor)、目的(destination)或匯點(sink)。
圖的結點和鏈接有時要添加標號(Label)和權重(weight),以便表示附加的信息。
如果兩條邊共享一個結點,那么它們是鄰接的(adjacent),一系列鄰接邊組成一條路徑(path)。例如,序列(v0,v1),(v1,v2),?,(vn-2,vn-1),(vn-1,vn)表示一條路徑,因為每條邊都與前一條邊或者后一條邊有一個公共結點。如果端點v0和vn是同一個結點,那么這條路徑稱為一個環(huán)(cycle)。河流網(wǎng)中沒有環(huán),而在鐵路系統(tǒng)中,一條往返旅行線路構成一個環(huán)。
3、圖的物理存儲。鄰接矩陣、鄰接表(書上P182)
4、關系代數(shù)對于空間網(wǎng)絡查詢的主要缺陷?傳遞閉包的概念?
5、答:無法計算傳遞閉包。圖G(V,E)的傳遞閉包G*是滿足下列條件的圖,它與G有相同的頂點集V,但它的邊集則由G的所有路徑組成。
6、SQL2 Connect語句的使用,會書上的例子。
7、SQL3 With Recursive 語句的使用
8、路徑查詢處理的種類:單對、單源、所有對。
9、答:一個常用的圖操作就是確定道路網(wǎng)中兩個點A和B之間的最短路徑,路徑計算可以分為:
單對(single pair):給定一個圖G=(V, E)和N中的頂點u與v,找出u與v之間的最優(yōu)路徑。單對的一個特例就是最短路徑問題。
單源(single source):給定一個源結點u,找出從u到G中所有可達結點之間的最優(yōu)路徑。--部分傳遞閉包(partial transitive closure)問題。
所有對(all pairs):在G中找出y的所有結點u和v之間的最優(yōu)路徑。--有關傳遞閉包的問題。
10、圖遍歷的含義,圖遍歷的方法--Breadth first search和Depth first search 答:圖遍歷(graph traversal)算法是所有路徑查詢的計算基礎,它沿著圖的邊,通過從一個結點到另一個結點的遍歷來搜索路徑。路徑搜索是一個遞歸的操作,需要不斷把結點的鄰接表從磁盤讀到內(nèi)存緩沖區(qū)中。所以,為了使圖操作的查詢處理更加快速、有效,必須對圖算法進行特別的設計,以使其I/O代價達到最小。
? Breadth first search-給定一個圖G以及G中的一個源結點v,BFS算法訪問所有從v可以到達的結點。算法首先訪問源結點v的所有直接鄰居。一個結點的直接鄰居就是該結點的鄰接表中的元素。然后算法遞歸地訪問直接鄰居的鄰接表,如此循環(huán)下去.(P196)? 與BFS算法正好相反,DFS算法先訪問源結點的一個直接鄰居,然后,在訪問其他直接鄰居之前,遞歸地訪問其后繼鄰居。如此一來,DFS算法是先沿著邊走完一條“路徑”,然后再返回到頂層去走其他的“路徑”。
11、Shortest Path 算法--掌握Dijktra’s algorithm、了解Best first algorithm。(P197)
設A為源點,求A到其他各頂點(B、C、D、E、F)的最短路徑。線上所標注為相鄰線段之間的距離,即權值。
12、點線面空間實體的存儲方法是否適用于空間網(wǎng)絡?為什么?
13、空間網(wǎng)絡數(shù)據(jù)的存儲一般需要考慮什么因素?非分離邊、分離邊的概念,連通性剩余率的含義及其計算;
答:最小的I/O操作成本。非分離邊:一條邊的兩個端點位于同一個磁盤頁中; 分離邊:一條邊的兩個端點位于不同磁盤頁中。
第五篇:空間數(shù)據(jù)庫期末復習重點總結
一、數(shù)據(jù)管理的發(fā)展階段
1、人工管理階段
2、文件系統(tǒng)階段
3、數(shù)據(jù)庫管理階段
注意了解各階段的背景和特點
二、數(shù)據(jù)庫系統(tǒng)的特點
1、面向全組織的復雜的數(shù)據(jù)結構
2、數(shù)據(jù)的冗余度小,易擴充
3、具有較高的數(shù)據(jù)和程序的獨立性:數(shù)據(jù)獨立性
數(shù)據(jù)的物理獨立性 數(shù)據(jù)的邏輯獨立性
三、數(shù)據(jù)結構模型三要素
1、數(shù)據(jù)結構
2、數(shù)據(jù)操作
3、數(shù)據(jù)的約束性條件
四、數(shù)據(jù)模型反映實體間的關系
1、一對一的聯(lián)系(1:1)
2、一對多的聯(lián)系(1:N)
3、多對多的聯(lián)系(M:N)
五、數(shù)據(jù)模型:
是數(shù)據(jù)庫系統(tǒng)中用于提供信息表示和操作手段的形式構架。
數(shù)據(jù)庫結構的基礎就是數(shù)據(jù)模型。數(shù)據(jù)模型是描述數(shù)據(jù)(數(shù)據(jù)結構)、數(shù)據(jù)之間的聯(lián)系、數(shù)據(jù)語義即數(shù)據(jù)操作,以及一致性(完整性)約束的概念工具的集合。概念數(shù)據(jù)模型:按用戶的觀點來對數(shù)據(jù)和信息建模。ER模型
結構數(shù)據(jù)模型:從計算機實現(xiàn)的觀點來對數(shù)據(jù)建模。層次、網(wǎng)狀模型、關系
六、數(shù)據(jù)模型的類型和特點
1、層次模型:
優(yōu)點:結構簡單,易于實現(xiàn)
缺點:支持的聯(lián)系種類太少,只支持二元一對多聯(lián)系
數(shù)據(jù)操縱不方便,子結點的存取只能通過父結點來進行
2、網(wǎng)狀模型:
優(yōu)點:能夠更為直接的描述世界,結點之間可以有很多聯(lián)系
具有良好的性能,存取效率高 缺點:結構比較復雜
網(wǎng)狀模型的DDL、DML復雜,并且嵌入某一種高級語言,不易掌握,不易使用
3、關系模型:
特點:關系模型的概念單一;(定義、運算)關系必須是規(guī)范化關系;
在關系模型中,用戶對數(shù)據(jù)的檢索操作不過是從原來的表中得到一張新的表。優(yōu)點:簡單,表的概念直觀,用戶易理解。
非過程化的數(shù)據(jù)請求,數(shù)據(jù)請求可以不指明路徑。
數(shù)據(jù)獨立性,用戶只需提出“做什么”,無須說明“怎么做”。堅實的理論基礎。
缺點:由于存儲路徑對用戶透明,存儲效率往往不如非關系數(shù)據(jù)模型
4、面向?qū)ο竽P?/p>
5、對象關系模型 七、三個模式和二級映像
1、外模式(Sub-Schema):用戶的數(shù)據(jù)視圖。是數(shù)據(jù)的局部邏輯結構,模式的子集。
2、模式(Schema):所有用戶的公共數(shù)據(jù)視圖。是數(shù)據(jù)庫中全體數(shù)據(jù)的全局邏輯結構和特性的描述。
3、內(nèi)模式(Storage Schema):又稱存儲模式。數(shù)據(jù)的物理結構及存儲方式。
4、外模式/模式映象:定義某一個外模式和模式之間的對應關系,映象定義通常包含在各外模式中。當模式改變時,修改此映象,使外模式保持不變,從而應用程序可以保持不變,稱為邏輯獨立性。
5、模式/內(nèi)模式映象:定義數(shù)據(jù)邏輯結構與存儲結構之間的對應關系。存儲結構改變時,修改此映象,使模式保持不變,從而應用程序可以保持不變,稱為物理獨立性。
八、數(shù)據(jù)視圖
數(shù)據(jù)庫管理系統(tǒng)的一個主要作用就是隱藏關于數(shù)據(jù)存儲和維護的某些細節(jié),而為用戶提供數(shù)據(jù)在不同層次上的抽象視圖,即不同的使用者從不同的角度去觀察數(shù)據(jù)庫中的數(shù)據(jù)所得到的結果—數(shù)據(jù)抽象。
九、規(guī)范化
1、幾個概念
候選碼(候選關鍵字):如果一個屬性(組)能惟一標識元組,且又不含有其余的屬性,那么這個屬性(組)稱為關系的一個候選碼(候選關鍵字)。碼(主碼、主鍵、主關鍵字):從候選碼中選擇一個唯一地標識一個元組候選碼作為碼 主屬性:任何一個候選碼中的屬性(字段)非主屬性:除了候選碼中的屬性外碼:關系模式R中屬性或?qū)傩越MX并非R的碼,但X是另一個關系模式的碼,則稱X是R的外部碼,簡稱外碼。
2、函數(shù)依賴
(1)設R(U)是一個屬性集U上的關系模式,X和Y是U的子集。若對于R(U)的任意一個可能的關系r,r中不可能存在兩個元組在X上的屬性值相等,而在Y上的屬性值不等,則稱 “X函數(shù)確定Y”或“Y函數(shù)依賴于X”,記作X→Y。X稱為這個函數(shù)依賴的決定屬性集(Determinant)。Y=f(x)
(2)在關系模式R(U)中,對于U的子集X和Y,如果X→Y,但Y ? X,則稱X→Y是非平凡的函數(shù)依賴 若X→Y,但Y ? X,則稱X→Y是平凡的函數(shù)依賴(3)在關系模式R(U)中,如果X→Y,并且對于X的任何一個真子集X’,都有X’/ →Y, 稱Y完全函數(shù)依賴于X,記作XF→Y。若X→Y,但Y不完全函數(shù)依賴于X,則稱Y部分函數(shù)依賴于X,記作XP→Y。
(4)在關系模式R(U)中,如果X→Y,Y→Z,且Y ?X,Y→X,則稱Z傳遞函數(shù)依賴于X。記為X傳遞→Z。注: 如果Y→X,即X←→Y,則Z直接函數(shù)依賴于X。
3、范式
范式是符合某一種級別的關系模式的集合
(1)范式種類:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、BC范式(BCNF)、第四范式(4NF)、第五范式(5NF)
1NF?2NF?3NF?BCNF?4NF?5NF(2)各種范式之間的聯(lián)系:
(3)定義:
1NF:如果一個關系模式R的所有屬性都是不可分的基本數(shù)據(jù)項,則R∈1NF。
存在的問題:插入異常、刪除異常、數(shù)據(jù)冗余度大、修改復雜
2NF:若關系模式R∈1NF,并且每一個非主屬性都完全函數(shù)依賴于R的碼,則R∈2NF。(所有非主屬性完全依賴每個候選關鍵字。)
3NF:關系模式R 中若不存在這樣的碼X、屬性組Y及非主屬性Z(Z ? Y), 使得X→Y,Y→Z成立,Y→X,則稱R ∈ 3NF。(所有非主屬性既不部分依賴于碼也不傳遞函數(shù)依賴碼。)
BCNF:設關系模式R∈1NF,如果對于R的每個函數(shù)依賴X→Y,若Y不屬于X,則X必含有候選碼,那么R∈BCNF。(每一個決定屬性集(因素)都包含(候選)碼,R中的所有屬性(主,非主屬性)都完全函數(shù)依賴于碼,R∈3NF。)性質(zhì):a、所有非主屬性都完全函數(shù)依賴于每個候選碼
b、所有主屬性都完全函數(shù)依賴于每個不包含它的候選碼 c、沒有任何屬性完全函數(shù)依賴于非碼的任何一組屬性
多值依賴:設R(U)是一個屬性集U上的一個關系模式,X、Y和Z是U的子集,并且Z=U-X-Y,多值依賴 X→→Y成立當且僅當對R的任一關系r,r在(X,Z)上的每個值對應一組Y的值,這組值僅僅決定于X值而與Z值無關
平凡多值依賴和非平凡的多值依賴:若X→→Y,而Z=φ,則稱X→→Y為平凡的多值依賴,否則稱X→→Y為非平凡的多值依賴。
4NF:關系模式R(U,F(xiàn))∈1NF,如果對于R的每個非平凡多值依賴X??Y(Y不包含于X),X都含有候選碼,則R ∈ 4NF
范式關系:
十、數(shù)據(jù)庫
數(shù)據(jù)庫:數(shù)據(jù)庫就是為了一定的目的,在計算機系統(tǒng)中以特定的結構組織、存儲、管理和應用的相關聯(lián)的數(shù)據(jù)集合??臻g數(shù)據(jù)庫:空間數(shù)據(jù)庫是存取、管理空間信息的數(shù)據(jù)庫??臻g數(shù)據(jù)庫管理系統(tǒng):空間數(shù)據(jù)庫管理系統(tǒng)是指能夠?qū)ξ锢斫橘|(zhì)上存儲的地理空間數(shù)據(jù)進行語義和邏輯上的定義;
1、提供必須的空間數(shù)據(jù)查詢、檢索和存取功能;
2、能夠空間數(shù)據(jù)進行有效的維護和更新的一套軟件系統(tǒng)??臻g數(shù)據(jù)庫應用系統(tǒng):提供給用戶訪問和操作空間數(shù)據(jù)庫的用戶界面,是應用戶數(shù)據(jù)處理需求而建立的具有數(shù)據(jù)庫訪問功能的應用軟件。一般需要進行二次開發(fā)。
數(shù)據(jù)庫系統(tǒng)組成:數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)、應用系統(tǒng)、數(shù)據(jù)庫管理員
空間信息的特征:
(1)幾何信息:描述了事物在空間中的位置及所占據(jù)的范圍
將地球表面以投影方式轉(zhuǎn)換為平面
通過平面幾何來抽象描述和研究事物的位置和范圍 用圖形和符號的方式來描繪這些空間相關的事物
(2)拓撲信息:研究空間相關的事物本身或者事物之間的在空間坐標變換下的不變性質(zhì)
事物本身的內(nèi)外關系
事物之間的相離、相接、相交 事物之間相連的布局
(3)屬性信息:與位置范圍無關的其它信息
描述了事物本身的內(nèi)在性質(zhì)和外在表現(xiàn) 事物之間的非位置關系
空間數(shù)據(jù)庫管理系統(tǒng)三層體系結構及每層的代表軟件:
標準DBMS存儲空間數(shù)據(jù)的局限性
(1)空間數(shù)據(jù)記錄是變長的(如點數(shù)的可變性),而一般的數(shù)據(jù)庫都只允許把記錄的長度設定為固定;
(2)在存儲和維護空間數(shù)據(jù)拓撲關系方面存在著嚴重缺陷;
(3)一般都難以實現(xiàn)對空間數(shù)據(jù)的關聯(lián)、連通、包含、疊加等基本操作;(4)不能支持復雜的圖形功能;
(5)單個地理實體的表達需要多個文件、多條記錄,一般的DBMS也難以支持;(6)難以保證具有高度內(nèi)部聯(lián)系的GIS數(shù)據(jù)記錄需要的復雜的安全維護。
GIS的發(fā)展演化
空間數(shù)據(jù)庫管理系統(tǒng)與傳統(tǒng)數(shù)據(jù)庫的區(qū)別:(1)數(shù)據(jù)量大
(2)需要處理與傳統(tǒng)數(shù)據(jù)庫中數(shù)據(jù)性質(zhì)相似的屬性數(shù)據(jù)和空間位置數(shù)據(jù)及它們之間的聯(lián)系 3)對數(shù)據(jù)的檢索涉及空間分析方法(4)數(shù)據(jù)應用廣泛,不局限于某個部門
GIS發(fā)展三個階段
1、第一代GIS(從60年代中期到80年代的中后期,是GIS軟件從無到有、從原型到產(chǎn)品的階段)
技術特點:以圖層作為處理的基礎
以系統(tǒng)為中心 單機、單用戶
全封閉結構支持二次開發(fā)能力非常弱
在主要實現(xiàn)技術上,以文件系統(tǒng)來管理幾何數(shù)據(jù)與屬性數(shù)據(jù) 應用領域基本上集中在資源與環(huán)境領域的管理類應用
2、第二代GIS(從80年代末到90年代中期,是GIS軟件成熟和應用快速發(fā)展的時期)技術特點:以圖層作為處理基礎
引入網(wǎng)絡技術,多機、多用戶 以系統(tǒng)為中心
支持二次開發(fā)的能力有所增強
以商用DBMS管理屬性數(shù)據(jù),但幾何數(shù)據(jù)仍用文件系統(tǒng)管理 應用領域開始有較大范圍的擴展,但基本上是管理類應用。
3、第三代GIS(90年代中期開始,估計將延續(xù)10年或稍長的時間)技術特點:仍然以圖層為處理的基礎,但面臨不斷演化
引入了Internet技術,開始向以數(shù)據(jù)為中心的方向過渡,實現(xiàn)了初步的(瀏覽型或簡單查詢型)的B/S結構
開放程度大幅度增加,組件化技術改造逐步完成
逐漸重視元數(shù)據(jù)問題,空間數(shù)據(jù)共享、服務共享和GIS系統(tǒng)互連技術不斷發(fā)展 GIS的標準化問題備受重視
實現(xiàn)空間數(shù)據(jù)與屬性數(shù)據(jù)的一體化存儲和初步的一體化查詢,并將不斷完善 應用領域迅速擴大,應用深度不斷提高,開始具有初步的分析決策能力。
展望新一代GIS 面向空間實體及其時空關系的數(shù)據(jù)組織與融合 統(tǒng)一的海量存儲、查詢和分析處理 有效的分布式空間數(shù)據(jù)管理和計算 一定的三維和時序處理能力 強大的應用集成能力
靈活的操縱能力和一定的虛擬現(xiàn)實表達
空間數(shù)據(jù)庫管理系統(tǒng)與GIS的聯(lián)系和區(qū)別 空間數(shù)據(jù)庫管理系統(tǒng)一般由專業(yè)GIS軟件提供
GIS—處理地理數(shù)據(jù)——以地球表面為基本參照框架的空間數(shù)據(jù)
SDBMS——處理空間數(shù)據(jù)(空間數(shù)據(jù)包括地理數(shù)據(jù),地理數(shù)據(jù)是空間數(shù)據(jù)的子集)GIS促進SDBMS的研究與發(fā)展
空間信息模型:
基于場的模型:用于表示具有連續(xù)的空間變化的情況,形狀不定的現(xiàn)象,采用柵格數(shù)據(jù)結構。
基于對象的模型:用于表示具有固定形狀的空間實體/概念,描述空間上離散的空間對象。采用矢量數(shù)據(jù)結構
空間數(shù)據(jù)庫設計的三個步驟
空間數(shù)據(jù)庫的設計是指在現(xiàn)在數(shù)據(jù)庫管理系統(tǒng)的基礎上建立空間數(shù)據(jù)庫的整個過程。概念模型:按用戶的觀點從現(xiàn)實應用中抽象出事物以及事物之間的聯(lián)系 邏輯建模:建立概念和聯(lián)系的邏輯結構
物理設計建模:對邏輯結構進行具體實現(xiàn)方面的安排和考慮;
存儲組織、索引、內(nèi)存管理……
E-R圖:
實體:現(xiàn)實中或者概念上獨立存在的事物或者對象,用矩形表示 屬性:刻畫實體性質(zhì)的數(shù)值或描述,用橢圓表示 聯(lián)系:表達實體間的關聯(lián),用菱形表示 重點:E-R圖設計
擴展E-R模型:象形圖
1、實體象形圖:
象形圖:象形圖是一種將對象插在方框內(nèi)的微縮圖表示,這些微縮圖用來擴展ER圖,并插到實體矩形框中的適當位置。
形狀:形狀是象形圖中的基本圖形元素,它代表著空間數(shù)據(jù)模型中的元素。
基本形狀: 復合形狀: 導出形狀: 備選形狀: 任意形狀:
用戶自定義形狀:
2、聯(lián)系象形圖:
聯(lián)系象形圖用來構建實體間聯(lián)系的模型
OGIS的4類幾何體(4類空間數(shù)據(jù)模型): 點——0維對象
線——1維對象,線串——2個或多個點表示 面——2維對象,多邊形
幾何體集合——表示復雜形狀,3類:
多點 多線 多面
幾何體集合——保證——幾何操作的閉合
常見拓撲屬性:
endpoint(point, arc)
點是弧的端點 simple-nonself-intersection(arc)
非自交的弧
on-boundary(point, region)
點在區(qū)域的邊界上 inside(point, region)
點在區(qū)域內(nèi)部 outside(point, region)
點在區(qū)域之外
open(region)
區(qū)域是開域(不包括邊界)close(region)
區(qū)域是閉域(包括邊界)
connected(region)
區(qū)域是連通域(區(qū)域上任2點,都有路徑相連)inside(point, loop)
點在環(huán)中 crosses(arc, region)
弧穿過區(qū)域 touches(region, region)
區(qū)域與區(qū)域相鄰 touches(arc, region)
弧與區(qū)域相鄰 overlap(region, region)
區(qū)域與區(qū)域重疊 常見非拓撲屬性:
Euclidean-distance(point, point)
2點間的歐氏距離 direction(point, point)
點在點的東面
length(arc)
弧的長度(單位向量長度為1個單位)
perimeter(area)
區(qū)域的周長(單位正方形的周長為4個單位)area(region)
區(qū)域的面積(單位正方形的面積為1個平方單位)
九交模型:
定義平面上2對象之間的拓撲關系 對象的3個部分: 內(nèi)部——A° 邊界——?A 外部——A-
九交矩陣:將兩個幾何形的內(nèi)部、邊界、外部分別兩兩做相交操作,操作的結果記為矩陣元素取值
矩陣元素取值: ?A??B?A???BA??B????0——交為空 ?9(A,B)???A?B??A??B?A?B??1——交為非空 ?A??B?A???BA??B????
九交矩陣可確定的二元拓撲關系種類:29=512 可實現(xiàn)的二元拓撲關系種類:8(相離(disjoint)、相接(meet)、交疊(overlap)、相等(equal)、包含(contain)、在內(nèi)部(inside)、覆蓋(cover)、被覆蓋(covered by))
關系代數(shù)(形式化的語言)
關系代數(shù)用到的運算符包括四類:集合運算符、專門的關系運算符、算術比較符、邏輯運算符。
并、差、交、笛卡爾積
選擇:滿足條件的元組,即行 投影:選取屬性列 連接:等值投影
自然連接(特殊的等值連接,要求兩個關系中進行比較的分量必須是相同的屬性組,在結果中把重復的屬性列去掉)
外連接:把舍棄的元組保存在結果中,在其他屬性值上填空值(NULL)左外連接:保留左邊關系要舍棄的元組 右外連接:保留右邊關系要舍棄的元組 除運算:了解象集
SQL標準每階段特點和增加的內(nèi)容 SQL-86 SQL-89:“具有完整性增強的數(shù)據(jù)庫語言SQL”,增加了對完整性約束的支持
SQL-92:“數(shù)據(jù)庫語言SQL”,是SQL-89的超集,增加了許多新特性,如新的數(shù)據(jù)類型,更豐富的數(shù)據(jù)操作,更強的完整性、安全性支持等。
SQL-3/SQL99:正在討論中的新的標準,將增加對面向?qū)ο竽P偷闹С?/p>
SQL中完成核心功能的9個動詞
數(shù)據(jù)定義:
常用完整性約束: 主碼約束:primary key 唯一性約束:unique 非空集約束:not null 參照完整性約束
數(shù)據(jù)查詢:
查詢滿足條件的元組:
%(百分號)代表任意長度(長度可以為0)的字符串 _(下橫線)代表任意單個字符 集函數(shù)包括:
COUNT([DISTINCT | ALL] *)統(tǒng)計元組個數(shù)
COUNT([DISTINCT | ALL] <列名>)統(tǒng)計一列中值的個數(shù) SUM([DISTINCT | ALL] <列名>)計算一列值的總和 AVG([DISTINCT | ALL] <列名>)計算一列的平均值 MAX([DISTINCT | ALL] <列名>)計算一列的最大值 MAX([DISTINCT | ALL] <列名>)計算一列的最小值 連接查詢包括: 廣義笛卡爾積
等值(含自然連接)非等值連接; 自身連接; 外連接; 復合條件連接 嵌套查詢
等值連接與自然連接區(qū)別
等值連接:在連接條件中使用等于號(=)運算符比較被連接列的列值,其查詢結果中列出被連接表中的所有列,包括其中的重復列。
自然連接:在連接條件中使用等于(=)運算符比較被連接列的列值,但它使用選擇列表指出查詢結果集合中所包括的列,并刪除連接表中的重復列。嵌套查詢分類:
不相關子查詢:子查詢的查詢條件不依賴于父查詢 相關子查詢:子查詢的查詢條件依賴于父查詢 不相關子查詢:由里向外逐層處理 相關子查詢:首先取外層查詢中表的第一個元組,根據(jù)它與內(nèi)層查詢相關的屬性值處理內(nèi)層查詢
集合查詢:并(union)交(intersect)差(minus)
SELECT語句的一般格式: SELECT [ALL|DISTINCT] <目標列表達式> [別名] [,<目標列表達式> [別名]] … FROM <表名或視圖名> [別名] [,<表名或視圖名> [別名]] … [WHERE <條件表達式>] [GROUP BY <列名1> [HAVING <條件表達式>]] [ORDER BY <列名2> [ASC|DESC] 完整性規(guī)則: 實體完整性 參照完整性
用戶定義的完整性:對于有NOT NULL約束的屬性列是否提供了非空值
對于有UNIQUE約束的屬性列是否提供了非重復值
對于有值域約束的屬性列所提供的屬性值是否在值域范圍內(nèi)
數(shù)據(jù)更新: 插入數(shù)據(jù): INSERT INTO <表名> [(<屬性列1>[,<屬性列2 >…)]
VALUES(<常量1> [,<常量2>]
…)修改數(shù)據(jù):
UPDATE <表名>
SET <列名>=<表達式>[,<列名>=<表達式>]…
[WHERE <條件>]; 刪除數(shù)據(jù): DELETE
FROM
<表名>
[WHERE <條件>]; 視圖的特點
? 虛表,是從一個或幾個基本表(或視圖)導出的表 ? 只存放視圖的定義,不會出現(xiàn)數(shù)據(jù)冗余
? 基表中的數(shù)據(jù)發(fā)生變化,從視圖中查詢出的數(shù)據(jù)也隨之改變 視圖操作:(同表操作差不多)定義視圖 查詢視圖 更新視圖
視圖的可更新性:
SQL Server 2000規(guī)定:
① 如果一個視圖是從多個基本表使用連接操作導出的,則不允許對這個視圖執(zhí)行更新操作。
② 如果在視圖定義中使用了聚集函數(shù)或DISTINCT短語或GROUP BY子句,則不允許對該視圖執(zhí)行更新操作。
③ 如果視圖的列的值為表達式或常數(shù),則不允許該這視圖執(zhí)行更新操作。
④ 如果視圖為行列子集視圖,則可以對該視圖執(zhí)行更新操作。視圖作用:
1.視圖能夠簡化用戶的操作
2.視圖使用戶能以多種角度看待同一數(shù)據(jù)
3.視圖對重構數(shù)據(jù)庫提供了一定程度的邏輯獨立性 4.視圖能夠?qū)C密數(shù)據(jù)提供安全保護
數(shù)據(jù)控制
SQL提供了數(shù)據(jù)控制功能,能在一定程度上保證數(shù)據(jù)的安全性、完整性、并提供了一定的并發(fā)控制和恢復能力。1.完整性:定義庫結構
2.安全性:存取控制,規(guī)定不同用戶對于不同數(shù)據(jù)對象允許執(zhí)行的操作,并控制各用戶它有權存取的數(shù)據(jù)。
3.并發(fā)控制和恢復:SQL支持事務、提交、回滾等概念。功能:
1、權限
2、授權
GRANT <權限>[,<權限>]… [ON <對象類型> <對象名>] TO <用戶>[,<用戶>]…[WITH GRANT OPTION];
3、收權
REVOKE <權限>[,<權限>]…
[ON <對象類型> <對象名>]
FROM <用戶>[,<用戶>]…;
SQL語言的空間擴展 OGIS類中操作分3類
1、用于所有幾何類型的基本操作
6個 SpatialReference()
返回幾何體的基本坐標系統(tǒng)
Envelope()
返回包含幾何體的最小外接矩形 Export()
返回以其他形式表示的幾何體 IsEmpty()
若幾何體為空集,則返回真
IsSimple()
若幾何體為簡單的(不自交的),則返回真 Boundary()
返回幾何體的邊界
2、用于空間對象之間拓撲關系的操作測試
8個
Equal
相等——若2個幾何體的內(nèi)部和邊界在空間上都相等,則返回真 Disjoint
相離——若2個幾何體的內(nèi)部和邊界都不相交,則返回真 Intersect
交疊——若2個幾何體相交,則返回真
Touch
相接——若2個面僅邊界相交,而內(nèi)部不相交,則返回真 Cross
橫過——若一條線和面的內(nèi)部相交,則返回真
Within
在內(nèi)部——若給定的幾何體的內(nèi)部不與另一個幾何體的外部相交,則返回真 Contains
包含——若給定的幾何體包含另一個幾何體,則返回真
Overlap
覆蓋/被覆蓋——若2個幾何體的內(nèi)部有非空交集,則返回真
3、用于空間分析的一般操作
7個
Distance
求距離——返回2個幾何體之間的最短距離
Buffer
求緩沖區(qū)——返回到給定幾何體距離小于等于指定值的幾何體的點的集合
ConvexHull
求最小閉包—— 返回幾何體的最小閉包
Intersection
集合交——返回2個幾何體的交集構成的幾何體
Union
集合并——返回2個幾何體的并集構成的幾何體 Difference
集合差——返回幾何體與給定幾何體不相交的部分
SymmDiff
返回2個幾何體與對方互不相交的部分
OGIS標準的局限性
局限用于——對象模型
場模型的操作——正研究 僅支持——基本拓撲的、空間度量的操作
不支持——方位的、動態(tài)的、基于形狀的、基于可見性的操作 數(shù)據(jù)字典
定義:用于描述數(shù)據(jù)庫的整體結構、數(shù)據(jù)內(nèi)容和定義等。一個好的數(shù)據(jù)字典可以說是一個數(shù)據(jù)的標準規(guī)范,它可使數(shù)據(jù)庫的開發(fā)者依此來實施數(shù)據(jù)庫的建立、維護和更新。用途:進行詳細的數(shù)據(jù)收集和數(shù)據(jù)分析所獲得的主要結果。內(nèi)容:數(shù)據(jù)項、數(shù)據(jù)結構、數(shù)據(jù)流、數(shù)據(jù)存儲、處理過程 空間索引
索引文件——用來提高數(shù)據(jù)文件查詢效率的輔助文件 索引文件的組成:
2個域:主碼域
數(shù)據(jù)文件的頁面地址
主索引——數(shù)據(jù)文件的記錄按主碼域排序,索引文件中只需保存數(shù)據(jù)文件的每個磁盤頁面的第一個主碼域的值。一維搜索碼的索引:B樹與B+樹 多維索引:
類似散列表的結構
固定網(wǎng)格 網(wǎng)格文件
基于樹形的結構
四叉樹 R樹 R+樹
數(shù)據(jù)庫查詢語言
兩種:關系代數(shù)——形式化的語言
組成:1種運算對象——關系(表)
6種運算——選擇、投影、并、笛卡爾積、差、交
結構化查詢語言(SQL)
事務的概念
事務是并發(fā)控制的基本單位。所謂事務,就是一個操作序列,這些操作要么都執(zhí)行,要么都不執(zhí)行,它是一個不可分割的工作單位。SQL Server以下列事務模式運行(1)自動提交事務(2)顯式事務(3)隱式事務 事務的特性 原子性 一致性 隔離性 持久性
語法格式為:
BEGIN TRANSACTION COMMIT TRANSACTION ROLLBACK TRANSACTION 鎖的概念
鎖定是Microsoft SQL Server Database Engine用來同步多個用戶同時對同一個數(shù)據(jù)塊的訪問的一種機制。
鎖的類型(1)共享鎖
共享鎖也稱為S鎖,允許并行事務讀取同一種資源,這時的事務不能修改訪問的數(shù)據(jù)。當使用共享鎖鎖定資源時,不允許修改數(shù)據(jù)的事務訪問數(shù)據(jù)。(2)排他鎖
排他鎖也稱為X鎖,它可以防止并發(fā)事務對資源進行訪問。(3)更新鎖
更新鎖也稱為U鎖,它可以防止常見的死鎖。更新鎖用來預定要對資源施加X鎖,它允許其他事務讀,但不允許再施加U鎖或X鎖。
活鎖
如果事務T1封鎖了數(shù)據(jù)R,事務T2又請求封鎖R,于是T2等待。T3也請求封鎖R,當T1釋放了R上的封鎖之后系統(tǒng)首先批準了T3的請求,T2仍然等待。然后T4又請求封鎖R,當T3釋放了R上的封鎖之后系統(tǒng)又批準了T4的請求,...,T2有可能永遠等待,這就是活鎖的情形。
避免活鎖的簡單方法是采用先來先服務的策略 死鎖
在兩個或多個任務中,如果每個任務鎖定了其他任務試圖鎖定的資源,此時會造成這些任務永久阻塞,從而出現(xiàn)死鎖。
事務 A 獲取了行 1 的共享鎖。事務 B 獲取了行 2 的共享鎖。
現(xiàn)在,事務 A 請求行 2 的排他鎖,但在事務 B 完成并釋放其對行 2 持有的共享鎖之前被阻塞。
現(xiàn)在,事務 B 請求行 1 的排他鎖,但在事務 A 完成并釋放其對行 1 持有的共享鎖之前被阻塞。
事務 A 必須在事務 B 完成之后才能完成,但事務 B 被事務 A 阻塞。這種情況也稱為循環(huán)依賴關系:事務 A 依賴于事務 B,而事務 B 又依賴于事務 A,從而形成了一個循環(huán)。除非某個外部進程斷開死鎖,否則死鎖中的兩個事務都將無限期等待下去。
Microsoft SQL Server Database Engine死鎖監(jiān)視器定期檢查陷入死鎖的任務。如果監(jiān)視器檢測到循環(huán)依賴關系,將選擇其中一個任務作為犧牲品,然后終止其事務并提示錯誤。
減少死鎖的方法:
(1)按同一順序訪問對象(2)避免事務中的用戶交互
(3)保持事務簡短并處于一個批處理中(4)使用較低的隔離級別
(5)使用基于行版本控制的隔離級別(6)使用綁定連接 存儲過程
SQL Server提供了一種方法,它可以將一些固定的操作集中起來由SQL Server數(shù)據(jù)庫服務器來完成,以實現(xiàn)某個任務,這種方法就是存儲過程。
在SQL Server中存儲過程分為兩類:即系統(tǒng)提供的存儲過程和用戶自定義的存儲過程。
可以使用三種方法創(chuàng)建存儲過程 :
1、使用創(chuàng)建存儲過程向?qū)?chuàng)建存儲過程。
2、利用SQL Server 企業(yè)管理器創(chuàng)建存儲過程。
3、使用Transact-SQL語句中的CREATE PROCEDURE命令創(chuàng)建存儲過程。創(chuàng)建命令格式:
CREATE
PROCEDURE
存儲過程名
[參數(shù)
數(shù)據(jù)類型
長度] [參數(shù)
數(shù)據(jù)類型
長度
OUTPUT] AS
SQL語句 執(zhí)行命令格式:
EXEC[ UTE ] 存儲過程名
[ 參數(shù)名= 參數(shù)值 ] [ 參數(shù)值1,參數(shù)值2,……] 刪除存儲過程
DROP procedure 存儲過程名 觸發(fā)器
是一種特殊類型的存儲過程,是通過事件進行觸發(fā)而被執(zhí)行的,而存儲過程通過存儲過程名被直接調(diào)用。觸發(fā)器是一個功能強大的工具,它使每個站點可以在有數(shù)據(jù)修改時自動強制執(zhí)行其業(yè)務規(guī)則。觸發(fā)器可以用于SQL Server約束、默認值和規(guī)則的完整性檢查。
觸發(fā)器是一種特殊類型的存儲過程,不由用戶直接調(diào)用。創(chuàng)建觸發(fā)器時會對其進行定義,以便在對特定表或列作特定類型的數(shù)據(jù)修改時執(zhí)行。
當創(chuàng)建一個觸發(fā)器時必須指定:
⑴名稱;
⑵在其上定義觸發(fā)器的表;
⑶觸發(fā)器將何時激發(fā);
⑷激活觸發(fā)器的數(shù)據(jù)修改語句。
使用命令創(chuàng)建觸發(fā)器
CREATE TRIGGER 觸發(fā)器名
ON 表/視圖名
[WITH
ENCRYPTION]:加密 syscomments 表中包含 REATE TRIGGER 語句文本的條目。使用 WITH ENCRYPTION 可防止將觸發(fā)器作為 SQL Server 復制的一部分發(fā)布,當使用“exec sp_helptext 觸發(fā)器名”時,查看不了語句
{ FOR|AFTER|INSTEAD OF }指定執(zhí)行觸發(fā)器而不是執(zhí)行觸發(fā) SQL 語句,從而替代觸發(fā)語句的操作
{ [DELETE][,][INSERT][,][UPDATE] }
[ NOT FOR REPLICATION]表示當復制進程更改觸發(fā)器所涉及的表時,不應執(zhí)行該觸發(fā)器。
AS
SQL 語句 刪除觸發(fā)器
DROP TRIGGER { trigger } [ ,...n ]
SQL Server2000安全機制(管理服務器的安全性、角色與用戶、管理權限)數(shù)據(jù)庫的安全性是指保護數(shù)據(jù)庫以防止不合法的使用所造成的數(shù)據(jù)泄漏、更改或破壞。系統(tǒng)安全保護措施是否有效是數(shù)據(jù)庫系統(tǒng)的主要指標之一。
安全機制:對于數(shù)據(jù)庫管理來說,保護數(shù)據(jù)不受內(nèi)部和外部侵害是一項重要的工作。SQL Server 2005的身份驗證、授權和驗證機制可以保護數(shù)據(jù)免受未經(jīng)授權的泄漏和篡改。
SQL Server 2005的安全模型分為3層結構,分別為服務器安全管理、數(shù)據(jù)庫安全管理和數(shù)據(jù)庫對象的訪問權限管理。
SQL Server 2005的身份驗證模式有兩種:Windows身份驗證模式和混合模式 SQL Server 2005數(shù)據(jù)庫管理系統(tǒng)利用角色設置,管理用戶的權限。這樣只對角色進行權限設置便可以實現(xiàn)對該角色中所有用戶權限的設置,大大減少了管理員的工作量。
在SQL Server 2005中,具有固定服務器角色、固定數(shù)據(jù)庫角色、用戶自定義數(shù)據(jù)庫角色和應用程序角色4種類型的角色
權限用來控制用戶如何訪問數(shù)據(jù)庫對象。一個用戶可以直接分配到權限,也可以作為一個角色中的成員來間接得到權限
SQL Server 2005中的權限分為3種:對象權限、語句權限和隱含權限。對象權限是用來控制一個用戶是如何與一個數(shù)據(jù)庫對象進行交互操作的,有5個不同的權限:查詢(Select)、插入(Insert)、修改(Update)、刪除(Delete)和執(zhí)行(Execute)。
GIS數(shù)據(jù)庫的設計
數(shù)據(jù)庫設計的基本目標:(1)滿足用戶需求(2)良好的數(shù)據(jù)庫性能(3)準確模擬現(xiàn)實世界
(4)能夠被某個數(shù)據(jù)庫管理系統(tǒng)接受
概念設計應滿足的要求:
(1)提供一個非專家理解的系統(tǒng)結構框架
(2)包含豐富的結構類型,能夠盡可能完整地描述系統(tǒng)的復雜性(3)能夠轉(zhuǎn)換成與實施相關的模型,以便能夠設計和實施該系統(tǒng) 概念設計的核心內(nèi)容:
(1)確定數(shù)據(jù)庫的數(shù)據(jù)組成(2)確定數(shù)據(jù)類型之間的關系(3)建立概念數(shù)據(jù)模型(4)形成書面文檔
概念設計的一般步驟和方法:(1)確定應用領域(2)確定用戶需求(3)選擇對象類型
(4)對象類型定義和屬性描述(5)對象類型的調(diào)整(6)幾何表示(7)關系(8)質(zhì)量要求(9)編碼
空間數(shù)據(jù)分層依據(jù):(1)專題內(nèi)容(2)幾何表達形式(3)拓撲特征的差別
(4)不同部門的數(shù)據(jù)通常放在不同的圖層,便于維護(5)不同安全級別的數(shù)據(jù)也應該單獨存儲(6)使用目的不同的數(shù)據(jù)應該單獨存放 地理數(shù)據(jù)模型的發(fā)展階段(3個):(1)CAD數(shù)據(jù)模型
(2)Coverage數(shù)據(jù)模型(第二代地理數(shù)據(jù)模型)(3)GeoDatabase數(shù)據(jù)模型(第三代地理數(shù)據(jù)模型)
要素集:是具有同樣幾何類型和屬性的要素集合?!噶繄D層 對象類:是GeoDatabase中存儲數(shù)據(jù)庫表——表 要素數(shù)據(jù)集:具有相同空間參考的要素類的集合
子類:在要素類內(nèi)部可以劃分若干個次一級的組,每個組是一個子類。每個子類有其自己的完整性規(guī)則和GIS行為。
拓撲關系:拓撲關系將參與拓撲的各個要素類集成在一個拓撲圖中作為一個拓撲單元來管理,規(guī)定同一個要素類中各個要素如何與其他要素共享幾何,或者不同要素類之間如何共享幾何。
ArcGIS中的三個數(shù)據(jù)庫:Personal Database、File Database、ArcSDE(ArcSDE+SQL構成空間數(shù)據(jù)庫)
選擇題(12‘)、填空題(10‘)、名詞解釋(20‘)、寫代碼(27‘)、簡答題(21‘)設計題(10‘)