前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇數據信息論文范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。
信息安全體系模型由基礎安全設施、信息安全管理、安全技術支撐和安全保障服務四個層面構成,為事后數據處理系統提供全面的安全體系保障。•基礎安全設施:基礎安全設施為數據處理系統信息安全體系建立一個可相互信任的環境,是其他安全技術實施的基礎。基礎安全設施以PKI(公鑰基礎設施)/PMI(特權管理基礎設施)/KMI(密鑰基礎設施)技術為核心,實現證書認證、權限管理、密鑰管理、可信時間戳、密碼服務等功能。•信息安全管理:在數據處理系統信息安全體系中,管理占有相當大的比重。信息安全管理包括策略管理、組織管理、制度管理、網絡管理、設備管理、系統管理、病毒管理、介質管理、安全審計管理等功能。•安全技術支撐:利用各類安全產品和技術建立起事后數據處理安全技術支撐平臺。安全技術支撐包括物理安全、運行安全和信息安全。物理安全包括環境安全、設備安全和介質安全;運行安全采用防病毒、入侵檢測和代碼防護等成熟技術對網絡進行防護;信息安全包括訪問控制、信息加密、電磁泄漏發射防護、安全審計、數據庫安全等功能。•安全保障服務:安全保障服務確保在出現自然災害、系統崩潰、網絡攻擊或硬件故障下,事后數據處理系統得以快速響應和恢復,并定期進行安全培訓服務,建立安全可靠的服務保障機制。
2體系劃分
2.1基礎安全設施
事后數據處理系統基礎安全設施是以PKI/PMI/KMI技術為基礎而構建的證書認證、權限管理、密鑰管理和密碼服務等基礎設施。基礎安全設施提供的技術支撐適用于整個事后數據處理系統,具有通用性。基礎安全設施的技術運行和管理具有相對的獨立性。1)證書認證證書認證是對數字證書進行全過程的安全管理。由證書簽發、密鑰管理、證書管理、本地注冊、證書/證書撤銷列表查詢、遠程注冊等部分構成。2)權限管理權限管理是信息安全體系基礎安全設施的重要組成部分。它采用基于角色的訪問控制技術,通過分級的、自上而下的權限管理職能的劃分和委派,建立統一的特權管理基礎設施,在統一的授權管理策略的指導下實現分布式的權限管理。權限管理能夠按照統一的策略實現層次化的信息資源結構和關系的描述和管理,提供統一的、基于角色和用戶組的授權管理,對授權管理和訪問控制決策策略進行統一的描述、管理和實施。建立統一的權限管理,不僅能夠解決面向單獨業務系統或軟件平臺設計的權限管理機制帶來的權限定義和劃分不統一、各訪問控制點安全策略不一致、管理操作冗余、管理復雜等問題,還能夠提高授權的可管理性,降低授權管理的復雜度和管理成本,方便應用系統的開發,提高整個系統的安全性和可用性。3)密鑰管理密鑰管理是指密鑰管理基礎設施,為基礎安全設施提供支持,并提供證書密鑰的生成、存儲、認證、分發、查詢、注銷、歸檔及恢復等管理服務。密鑰管理與證書認證服務按照“統一規劃、同步建設、獨立設置、分別管理、有機結合”的原則進行建設和管理,由指定專人維護管理。密鑰管理與證書認證是分別設立,各自管理,緊密聯系,共同組成一個完整的數字證書認證系統。密鑰管理主要為證書認證提供用戶需要的加密用的公/私密鑰對,并為用戶提供密鑰恢復服務。4)密碼服務密碼服務要構建一個相對獨立的、可信的計算環境,進行安全密碼算法處理。根據系統規模,可采用集中式或分布式計算技術,系統性能動態可擴展。事后數據處理系統采用集中式計算技術。
2.2安全技術支撐
安全技術支撐是利用各類安全產品和技術建立起安全技術支撐平臺。安全技術支撐包括物理安全、運行安全和信息安全。物理安全包括環境安全、設備安全和介質安全;運行安全包括防病毒、入侵檢測和代碼防護等;信息安全包括訪問控制、信息加密、電磁泄漏發射防護、安全審計、數據庫安全等功能。
2.2.1物理安全
物理安全的目標是保護計算機信息系統的設備、設施、媒體和信息免遭自然災害、環境事故、人為物理操作失誤、各種以物理手段進行的違法犯罪行為導致的破壞、丟失。物理安全主要包括環境安全、設備安全和介質安全三方面。對事后數據處理中心的各種計算機、外設設備、數據處理系統等物理設備的安全保護尤其重要。對攜帶進入數據處理中心的U盤、移動硬盤、可攜帶筆記本等移動介質進行單獨安全處理。
2.2.2運行安全
運行安全采用防火墻、入侵檢測、入侵防護、病毒防治、傳輸加密、安全虛擬專網等成熟技術,利用物理環境保護、邊界保護、系統加固、節點數據保護、數據傳輸保護等手段,通過對網絡和系統安全防護的統一設計和統一配置,實現全系統高效、可靠的運行安全防護。系統安全域劃分為事后數據處理中心專網安全域、靶場專網安全域、外聯網安全域。事后數據處理中心專網與靶場專網安全域邏輯隔離,靶場專網與外聯網安全域邏輯隔離。1)防火墻防火墻技術以包過濾防火墻為主,對系統劃分的各個安全域進行邊界保護。在事后數據處理中心出入口、網絡節點出入口、外網出入口等節點安裝配置防火墻設備,保證數據傳輸安全。2)入侵檢測入侵檢測對事后數據處理系統的關鍵安全域進行動態風險監控,使用成熟的入侵檢測技術對整個系統網絡的入侵進行防控。3)病毒防治在各網絡節點保證出入站的電子郵件、數據及文件安全,保證網絡協議的使用安全,防止引入外部病毒。在事后數據處理系統的重要系統服務器(包括專業處理服務器、數據服務器等)配置服務器防病毒產品。在所有桌面系統配置防病毒防護產品,提供全面的跨平臺病毒掃描及清除保護,阻止病毒通過軟盤、光盤等進入事后數據處理系統網絡,同時控制病毒從工作站向服務器或網絡傳播。在事后數據處理中心配置防病毒管理控制中心,通過安全管理平臺管理控制服務器、控制臺和程序,進行各個防病毒安全域的防病毒系統的管理和配置。
2.2.3信息安全
信息安全包括訪問控制、信息加密、電磁泄漏發射防護、安全審計、數據庫安全等功能。信息安全技術是保證事后數據處理中心的原始測量數據、計算結果數據、圖像數據等各類數據的安全技術,使用成熟的安全信息技術產品完成全面的信息安全保障。1)訪問控制訪問控制主要包括防止非法的人員或計算機進入數據處理中心的系統,允許合法用戶訪問受保護的系統,防止合法的用戶對權限較高的網絡資源進行非授權的訪問。訪問控制根據方式可分為自主訪問控制和強制訪問控制。自主訪問控制是事后數據處理中心各級用戶自身創建的對象進行訪問,并授予指定的訪問權限;強制訪問控制是由系統或指定安全員對特定的數據、對象進行統一的強制性控制,即使是對象的創建者,也無權訪問。2)安全審計事后數據處理中心運用安全審計技術對系統的軟件系統、設備使用、網絡資源、安全事件等進行全面的審計。可建立安全保密檢測控制中心,負責對系統安全的監測、控制、處理和審計,所有的安全保密服務功能、網絡中的所有層次都與審計跟蹤系統有關。3)數據庫安全數據庫系統的安全特性主要是針對數據而言的,包括數據獨立性、數據安全性、數據完整性、并發控制、故障恢復等幾個方面。
3事后處理系統解決方案
事后數據處理系統主要用于完成遙測和外測的事后數據處理任務,提供目標內外彈道參數,并存儲和管理各類測量數據,為各種武器試驗的故障分析和性能評定提供支撐和依據。該系統必須具備的主要功能如下:•海量的數據輸入輸出和存儲管理功能;•快速的各類試驗測量數據處理功能;•可靠的數據質量評估和精度分析功能;•有效的信息安全防護功能;•強大的數據、圖像、曲線顯示分析以及報告自動生成功能。建立事后數據處理系統信息安全運行與管理的基礎平臺,構建整個系統信息安全的安全支撐體系,保證事后數據處理系統各種業務應用的安全運行,通過技術手段實現事后數據處理系統安全可管理、安全可控制的目標,使安全保護策略貫穿到系統的物理環境、網絡環境、系統環境、應用環境、災備環境和管理環境的各個層面。•實現事后數據處理任務信息、型號信息、處理模型、模型參數、原始數據、計算結果、圖像數據的安全保護;•建立起認證快捷安全、權限/密鑰管理完備、密碼服務安全的安全設施;•建立起功能齊全、協調高效、信息共享、監控嚴密、安全穩定的安全技術支撐平臺;•建立事后數據處理系統信息安全體系的技術標準、規范和規章制度。
4結語
關鍵詞:數據通信無線網絡技術新興領域
一、無線網絡概述
無線網絡技術涵蓋的范圍很廣,既包括允許用戶建立遠距離無線連接的全球語音和數據網絡,也包括為近距離無線連接進行優化的紅外線技術及射頻技術。通常用于無線網絡的設備包括便攜式計算機、臺式計算機、手持計算機、個人數字助理(PDA)、移動電話、筆式計算機和尋呼機。無線技術用于多種實際用途。例如,手機用戶可以使用移動電話查看電子郵件。使用便攜式計算機的旅客可以通過安裝在機場、火車站和其他公共場所的基站連接到Internet。在家中,用戶可以連接桌面設備來同步數據和發送文件。
二、無線網絡的標準
為了解決各種無線網絡設備互連的問題,美國電機電子工程師協會(IEEE)推出了IEEE802.11無線協議標注。目前802.11主要有802.11b、802.11a、802.11g三個標準。最開始推出的是802,11b,它的傳輸速度為lIMB/s,最大距離室外300米,室內約50米。因為它的連接速度比較低,隨后推出了802.11a標準,它的連接速度可達54MB/s。但由于兩者不互相兼容,致使一些早已購買802.11b標準的無線網絡設備在新的802,11a網絡中不能用,所以IEEE又正式推出了完全兼容802.11b標準且與802.11a速率上兼容的802.11g標準,這樣通過802.11g,原有的802.11b和802.11a兩種標準的設備就可以在同一網絡中使用。IEEE802.11g同802.11b一樣,也工作在2.4GHz頻段內,比現在通用的802.11b速度要快出5倍,并且與802,11完全兼容,在選購設備時建議弄清是否支持該協議標準。選擇適合自己的,802.11g標準現在已經開始普及。
三、無線網絡類型
(一)無線廣域網(WWAN)。無限廣域網技術可使用戶通過遠程公用網絡或專用網絡建立無線網絡連接。通過使用由無線服務提供商負責維護的若干天線基站或衛星系統,這些連接可以覆蓋廣大的地理區域,例如若干城市或者國家(地區)。目前的WWAN技術被稱為第二代(2G)系統。2G系統主要包括移動通信全球系統(GSM)、蜂窩式數字分組數據(CDPD)和碼分多址(CDMA)。現在正努力從2G網絡向第三代(3G)技術過渡。一些2G網絡限制了漫游功能并且相互不兼容;而第三代(3G)技術將執行全球標準,并提供全球漫游功能。ITU正積極促進3G全球標準的指定。
(二)無線局域網(WLAN)。無線局域網技術可以使用戶在本地創建無線連接(例如,在公司或校園的大樓里,或在某個公共場所,如機場)。WLAN可用于臨時辦公室或其他無法大范圍布線的場所,或者用于增強現有的LAN,使用戶可以在不同時間、在辦公樓的不同地方工作。WLAN以兩種不同方式運行。在基礎結構WLAN中,無線站(具有無線電網卡或外置調制解調器的設備)連接到無線接入點,后者在無線站與現有網絡中樞之間起橋梁作用。在點對點(臨時)WLAN中,有限區域(例如會議室)內的幾個用戶可以在不需要訪問網絡資源時建立臨時網絡,而無需使用接入點。
(三)無線個人網(WPAN)。無線個人網技術使用戶能夠為個人操作空間(POS)設備(如PDA、移動電話和筆記本電腦等)創建臨時無線通訊。POS指的是以個人為中心,最大距離為10米的一個空間范圍。目前,兩個主要的胛AN技術是“Bluetooth”和紅外線。“Bluetooth”是一種電纜替代技術,可以在30英尺以內使用無線電波傳送數據。Bluetooth數據可以穿過墻壁、口袋和公文包進行傳輸。“Bluetooth專門利益組(SIG)”推動著“Bluetooth”技術的發展,于1999年了Bluetooth版本1.0規范。作為替代方案,要近距離(一米以內)連接設備,用戶還可以創建紅外鏈接。
為了規范無線個人網技術的發展,IEEE已為無線個人網成立了802.15工作組。該工作組正在發展基于Bluetooth版本1.0規范的WPAN標準。該標準草案的主要目標是低復雜性、低能耗、交互性強并且能與802.11網絡共存。
無線個人網和無線局域網并不一樣。無線個人網是以個人為中心來使用的無線個人區域網,它實際上就是一個低功率、小范圍、低速度和低價格的電纜替代技術。但無線局域網卻是同時為許多用戶服務的無線網絡,它是一個大功率、中等范圍、高速率的局域網。
最早使用的WPAN是1994年愛立信公司推出的藍牙系統,其標準是[EEE802.15.1[w-BLUE]。藍牙的數據率為720kb/s,通信范圍在10米左右。為了適應不同用戶的需求,無線個人網還定義了另外兩種低速WPAN和高速WPAN。
(四)無線城域網(WMAN)。無線城域網技術使用戶可以在城區的多個場所之間創建無線連接(例如,在一個城市或大學校園的多個辦公樓之間),而不必花費高昂的費用鋪設光纜、銅質電纜和租用線路。此外,當有線網絡的主要租賃線路不能使用時,WWAN還可以作備用網絡使用。WWAN使用無線電波或紅外光波傳送數據。為用戶提供高速Internet接入的寬帶無線接入網絡的需求量正日益增長。盡管目前正在使用各種不同技術,例如多路多點分布服務(MMDS)和本地多點分布服務(LMDS),但負責制定寬帶無線訪問標準的IEEE802.16工作組仍在開發規范以便實現這些技術的標準化。
無線城域網服務范圍可覆蓋一個城市的部分區域,通信的距離變化較大(遠的可達50公里),因此接收到的信號功率和信噪比等也會有很大的差別。這就要求有多種的調制方法。因此工作在毫米波段的802.16必須有不同的物理層。802.16的基站可能需要多個定向天線,各指向對應的接收點。由于天氣條件(雨、雪、雹、霧等)對毫米波的傳輸的影響較大,因此與室內工作的無線局域網相比較時,802.16對差錯的處理也更為重要。
關鍵詞:土地信息系統、數據質量、誤差、分辨率、坐標變換、矢量數據、柵格數據、拓撲
Abstract:DataisveryimportantforLandInformationSystem,AkeytoLandinformationthesystem''''sdevelopmentssuccessiswhetherthedataquantityisaccuracy.ThispaperwillStudythedataquantitytheprobleminLandinformationthesystemestablishtheprocess.
Keywords:LandInformationSystems;DataQuality;Error;Accuracy;RemoteSensing;Digitize;Resolution;CoordinateTransformation;VectorData;RasterData;Topological.
一、前言
土地是人類的寶貴財富,是人類社會進行物質生產所必需的基本條件和自然基礎。如何科學、合理地利用有限的土地資源,如何及時了解與掌握土地利用變化數量和空間特點,對于保持耕地總量動態平衡和土地持續利用具有十分重要的意義。
隨著社會經濟的日趨多樣化,土地部門的業務工作及范圍也在不斷擴大,原有的靠手工操作,圖紙管理的模式已經越來越不能滿足高效率的需求。為強化土地管理,滿足社會對土地資源信息更多、更細、更完善的服務要求,各土地管理部門紛紛加入信息化、數字化的改革大潮。特別是在市場經濟條件下,因土地管理部門工作的嚴肅性、準確性、科學性和規范化要求,管理中任何規定的確定和變更都需要完成大量的信息收集、分析、綜合、決策和評估等工作,土地管理也只有強有力的信息技術(IT)的支持下,才能做到真正的科學決策和管理。
土地信息系統(LIS)是地理信息系統的一個分支,是一種基于宗地[以宗地(地塊)為單位]的計算機管理信息系統。是一種利用計算機技術及其屬性數據進行采集、處理、管理、查詢、分析、應用和維護更新的空間信息系統,是土地管理的現代化工具,是土地規劃和管理定量化、科學化的方法、手段。但是,在土地信息系統的建設過程中,還存在許多問題,給土地信息系統的建設及發揮帶來一定困難。這里僅對土地信息系統建設中的數據質量問題進行探討。
二、對LIS數據質量的認識
數據是一種未經加工的原始資料,是客觀對象的表示,它可以是數字、文字、符號、圖像,數據是信息的具體表達形式。一個LIS系統包括空間數據、屬性數據、空間數據之間的關系以及空間數據與屬性數據之間的關聯。
人們往往以為計算機為基礎的信息系統的數據質量是可靠的,很少懷疑利用信息系統產生的分析結果在數據質量方面會有問題,但事實遠非如此。在某些情況下,由于多種原因,計算機分析的結果甚至會比手工分析的誤差更大。這里除軟件、硬件的質量問題,計算方法上的問題,以及分類、編碼、輸入、操作的明顯疏忽外,數據本身的質量是重要的原因。
眾所周知,數據是LIS的“血液”,是組成系統的重要元素。數據質量的好壞是土地信息系統成功與否的關鍵所在;數據質量的高低優劣,都直接影響到土地信息系統的經濟效益和社會效益,決定了系統應用價值的大小;數據的可靠,質量的好壞將直接影響到整個系統的成敗。系統如果不能提供正確、可靠的信息,這個系統也就失去了存在的價值。
數據質量的好壞是一個相對概念,并具有一定的針對性。衡量其好壞主要有以下幾個指標:誤差、數據的準確度、數據的精度和不確定性[1]。數據質量是數據整體性能的綜合體現。
統而言之,數據的質量問題主要表現在兩個方面:一是數據是否及時反映了現實世界;二是數據是否保持了一致性和完整性。
土地信息系統的數據量大,數據來源廣,數據采集的任務重,在數據庫建立過程中會出現許多人為和系統的誤差,甚至還有可能產生數據錯誤,最后采集的數據無法準確反映規劃和管理的實際狀況,建立在此數據庫基礎上的系統往往也就達不到管理自動化輔助決策的目的,而只不過是“看看而已”的一種“擺設”罷了。
數據庫(包括空間數據庫和非空間數據庫)是土地信息系統最基本、最重要的組成部分,也是投資比重最大的部分。數據質量的好壞,直接影響系統的功能和應用。不僅要根據技術規程衡量數據質量,還要從數據使用角度分析數據質量問題。數據質量通常是指數據的可靠性和精度,它主要用數據的誤差來度量的。現就土地信息系統建立過程中的數據質量問題作進一步的探討。
三、數據源質量的問題
土地信息系統的數據源指建庫中所需要的各種數據類型的來源。它是土地信息系統最基本、最重要的組成部份。土地信息系統的數據源多種多樣,主要包括有:地圖,地圖是系統最主要的數據源,因為地圖是地理數據的傳統描述形式,是具有共同參考坐標系統的點、線、面的二維平面形式的表示,內容豐富,圖上實體間的空間關系直觀,而且實體的類別和屬性可以用各種不同的符號加以識別和表示。土地信息系統其圖形數據大部分都來自地圖,土地信息系統的屬性數據主要有地籍圖、宗地圖、土地詳查圖、土地利用現狀圖、行政區劃圖、專題圖、乃至地形圖等各種圖件的矢量化地圖數據。二是遙感影像數據,遙感影像數據是一個極其重要的信息源。通過遙感影像可以快速、準確地獲得大面積的、綜合的各種專題信息,航天遙感影像還可以取得周期性的資料,這些都為土地信息系統提供了豐富的信息。三是統計數據,包括土地的分類、面積、權屬、分布及質量、等級狀況、利用狀況、非法占地等統計資料。四是實測數據,包括GPS點位數據、地籍測量數據等。五是數字數據,包括數字圖形數據和屬性數據。數字數據主要有地籍號、檔案卷宗號、地類號、圖號、手簿號、宗地界址點點號及坐標控制點坐標,宗地面積,面積中誤差、年代、日期等等。屬性數據包括圖形、圖像以外的各種文字、數字信息。其中文字信息主要是與宗地檔案,文件檔案組成相關的各種檢索和查詢信息(如:土地權利人姓名或單位各稱、土地座落,文件檔案的標題、發文機關、公文字號等等),以及土地登記、地籍調查、權屬審核、登記發證各辦公流程中的各種鍵盤輸入信息。六是各種立法文件和文字檔案,主要有地籍檔案、文件檔案等具有法律效力或需要經常查閱的原始文件材料,它們是土地信息的重要組成部分,在土地的規劃管理中起著很大的作用。
數據源質量問題指數據的采集和錄入中可能產生的誤差,建庫所需的各種類型的數據的可靠性和精度。
從土地信息系統建立的過程來看,它的主要因素有:各種測量數據,地圖和遙感數據等的誤差;調查和統計造成的屬性數據誤差,以及文檔數據的錯誤等,數字化前的預處理、手扶踀自動化的分辨率和矢量化精度。
1、遙感數據
地理信息系統、遙感和計算機輔助制圖是現代地理學的重要技術手段。遙感作為一種獲取和更新空間數據的強有力手段,能及時地提供準確、綜合和大范圍進行動態監測的各種資源與環境的信息,因此遙感數據是土地信息系統的一個重要數據源。
所謂遙感(RemoteSensing)就是遙遠感知的意思,也就是不直接接觸目標物和現象,在距離地物幾公里到幾百里、甚至上千里的飛機、飛船、衛星上,使用光學或電子儀器接受地面物體或發射的電磁波信號,并從圖像膠片或數據磁帶形式記錄下來,傳送到地面,經過信息處理,判讀分析和野外實地驗證,最終服務于有關部門的規劃決策[2]。土地管理部門可以運用遙感技術快速獲取現狀空間的信息。
盡管遙感技術有很多好處,但因其自身特性,獲取的遙感數據可能存在一些誤差。如:不同的高度引起的問題,由于傳感器的結構及穩定性產生的問題,對信號進行數字化產生的誤差。傳感器在航線、航向上出現的誤差,大氣輻射產生的誤差,地形和地貌等因素產生的誤差等等。在遙感資料的獲取時,有些誤差是可以控制的,有些則不可控。因此必須對原始數據進行預處理,包括利用地面控制對原始數據進行幾何校正,圖像增強和分類。對獲取的遙感數據進行光譜校正,特征提取,自動識別分類、自動成圖等處理[3]。
2、測量數據
各種原始的測量數據是土地信息系統的主要來源之一。包括宗地的權屬界線、位置、形狀、數量、面積、各級行政界線、地形圖測量等。由于人和環境的因素,測量數據不可避免地受到人為誤差(對中、讀數、平分等誤差)、儀器、環境的影響。來源于地面測量的數字數據中含有控制測量和碎部測量誤差。其中控制點誤差又受控制網的參考基準、網形和觀測精度以及觀測費用等因素的影響。碎部點誤差除了繼承了控制點的誤差外,還受自身觀測方法,觀測精度和地界的人為判斷,以及地物地貌的取舍等因素的影響。當然原始數據誤差受觀測儀器、觀測者和外界環境三種因素影響。除此之外,還有測量數據的實時性以及數據老化,采集數據的密度不合理,或概括取舍不合理,選取測量規范標準不一致或精度等級不一致造成測量數據的不一致的影響。
地籍要素是構建土地信息系統極為關鍵的一步,其測量數據的精度高低決定了系統功能能否得到正確和充分發揮。
從地籍測量成果的有效性和土地管理的可能性來考慮,為了保證各權屬單元之間的界線清晰,邊界無爭議,并且雙方都能接受而不損害他人和國家的利益,地籍測量要達到一定精度。因此,必須要有相應的數據采集方法作為保證。地籍要素的采集方法目前主要有兩種,一種是傳統的模擬式外業測圖方法,另一種是野外全數字化數據采集方法。傳統方法的主要作法是在地籍控制測量的基礎上,用解析法測量出權屬界址點坐標,以控制點或以界址點為基礎施測成地籍圖,要形成入庫數據信息,則要通過對原圖數字化來實現。用傳統數據采集方法形成地籍要素數字信息其誤差影響因素較多,主要誤差來源為:測站點誤差m1,量距誤差m2,在測圖板上描繪方向線誤差為m3,刺點誤差m4,數字化儀采點誤差m5等。按有關專著論述,一般情況下,m1≈±0.12mm,m2≈±0.2,m3≈±0.1mm,m4≈±0.14mm,這四項誤差為野外采集誤差。數字化m5的影響因素比較復雜,誤差產生首先與圖形要素有關,要素本身的復雜程度對數字化精度有顯著影響,數字化儀本身的精度更應引起重視。正常情況下,用常規數字化儀進行數字化時,精度一般可達到±0.13mm。綜合上述得,地籍要素采集精度m采為:
m采=±
=±
=±0.02mm
按1:500比例尺來考慮,實地誤差將達到±10cm,由此可見,按傳統方法施測,則擬入庫的地籍要素信息很難達到規定的±5cm的精度標準[4]。
采用野外全數字化方法,界址點野外數據采集一般采用直接測定坐標法,即將全站儀或測距儀置于測站點上,對界址點上的移動棱鏡進行水平角和距離測定,電子手薄記錄計算。此種方法的主要誤差來源為水平角測角誤差mβ和測距誤差mD,測角中誤差角保守為±5″,測距誤差主要來自移動棱鏡偏離界址點位置誤差,其偏離值按2cm考慮。測距平均邊長取100m,按點位誤差精度估算公式m2=來計算,則m≈±2cm,即便考慮測站誤差和其他偶然的聯合影響,點位精度也肯定在規定范圍內,所以地籍要素信息數據的野外全數字化有利于提高界址點精度,從而保證地籍數據的質量。
3、調查、統計、文檔數據問題
土地信息系統的建設過程中,涉及大量的調查統計數據,這些資料尚存在許多不足之處,為土地信息系統的建設帶來了一定困難。
建立土地信息系統,必須首先進行土地基本信息的搜集,開展地籍調查工作,核實宗地權屬,掌握土地利用狀況,獲得宗地位置、形狀及其面積的準確數據,為建庫奠定基礎。
現就地籍調查工作加以探討,眾所周知,權屬調查的工作之一是填寫地籍調查表。由于權屬調查技術性強,工作量大,參與人員多且水平不同等原因,填寫后的地籍調查表或多或少會出現下面一些問題。在填土地使用者名稱時,單位本應填寫全稱,可出現了類似這樣的情況:某林業局有3宗地,而在3份地籍調查表上出現了xx林業局、縣林業局、林業局等名稱。按這樣的名稱錄入建立信息系統,將導致不能正確地自動的歸戶。在填寫土地使用者性質時,本應該寫“全民”或“集體”或“個體”或“個人”,而出現了“國營”或“國有”或“私營”這樣的名詞。在填寫宗地四至時應說明權屬界線所經地物名稱及歸屬、位置、與誰接壤。但出現了東(南、西、北)至xx,而未填出接xx。且有的四至填寫錯誤,如兩宗地共用一堵墻時,則只能出現兩宗都至墻中,或一宗至墻內另一宗至墻外,但填出了兩宗都至墻外或墻內等情況。在填寫界址標示處的界址線位置時也有類似錯誤,有的表填寫字跡潦草,或使用簡化字,讓人難以辨認。有的內容還可以猜出,但戶主的姓名、調查員、勘丈員的簽名等內容實在難辯;有的表中該填的內容而未填,任意涂改。
共用宗的處理,一個地塊被幾個權屬單位共同使用,而其間又難以劃清權屬界線,這樣的地塊稱為共用宗[5]。不少縣(市)是這樣處理的:有多少土地使用者就填多少份地籍調查表,表上的內容按各分宗填寫。這樣做的好處是所填的內容詳細,調查表和土地登記申請書、審批表形成一一對應的關系。但其弊端也是顯而易見的,其一較大地增大了填表的工作量,其二增大了復雜程度,在填寫四至時,如遇一個土地使用者使用幾個地塊則不得不寫清幾個地塊的四至;為填清界址指標,又得設置內部界址點,增加了宗地草圖和地籍圖的負荷量,填表時如不小心還會造成表與表之間的相互矛盾。為了和地調表統一,有的在形成宗地界址點成果表時,除了有宗地界址點成果表外,還有分宗的界址點成果表。如果內部界址點是在紙圖上圖解的,則將該宗地的宗地界址點和內部界址點和計算機展點后,會出現界址線混亂的情況。在土地信息系統建庫時,這些內部點是不能當界址點錄入進庫的。如進庫則在面積統計時,這種內部界址點所圍成的區域的面積就被多統計了一次。
建立完備的信息系統,必須具備這樣的條件:大比例的地形圖或地籍圖;野外測量的界址點數據;宗地的屬性數據(土地登記申請書、地籍調查表、審批表等)。全省在進行大大規模的城鎮地籍時,由于受當時的條件限制,自動化程度低,各作業單位作業水平的不同,或多或少出現一些問題。在建庫時所發現的問題主要是界址點的坐標成果與地籍上的位置不吻合;相鄰宗的同一界址點坐標不同;界址邊長、宗地面積計算有誤。某些縣(市)為了進行土地登記,由于多方面的原因,在進行初始地籍調查時,只作權屬調查,不作規范的地籍測量。為了計算面積,用皮尺或鋼尺丈量界址邊長及相關尺寸,用幾何圖形法計算出宗地面積,而不測址點坐標和地籍圖。這樣做不利于信息化的管理。
4、圖形數字化
影響數據質量的因素是多方面的,有相當一部分來自于建庫過程中的數字化過程。建庫過程中的數據質量,包括數字化前的預處理,紙張變形、手扶跟蹤數字化精度或掃描數字化的分辨率和矢量化精度。
(1)數字化前的預處理
用于數字化作業的地形圖(工作底圖)一般采用聚酯薄膜圖,其變形一般小于0.2‰。采用紙質圖紙時,圖紙的尺寸隨濕度和溫度的變化而變化,溫度不變的情況下,溫度由0%增至25%,則紙的尺寸可能改變1.6%[6]。因為紙的膨脹率和收縮率不相同,即使溫度回到原來的大小,圖紙也不能恢復原來的尺寸。因此在數字化時要適當的比例因子,通過仿射變換進行幾何糾正,以減小工作底圖變形產生的位置誤差,達到相應的精度。
對不同種類和比例的工作底圖進行數字化時,應注意它的投影方式是否一致,比例是否匹配。對于不同投影方式應在數字化后及時變換為系統要求的投影方式。對于不同比例應將比例尺和精度記錄到元數據中,以便估記由此可能產生的誤差。
(2)跟蹤數字化
手扶跟蹤數字是一種自動化精度較低的數字化方式,其數字化精度也因操作員及其工作的疲勞程度而異,操作員的勞動強度較高。隨著大幅面掃描儀的成本不斷降低,掃描和矢量化技術不斷完善,這種數字化方式可能成為自動掃描數字化的一種補充。
手扶數字化是從地形圖輸入空間數據的最廣泛采用的輸入方法。把地形圖放置于數字化桌上,用手持設備,跟蹤每一個地圖特征、數字化設備精確量測鼠標的位置,產生數據形式的坐標數據。
影響跟蹤數字化數據質量的因素很多;主要有:數字化底圖中地理要素的寬度、密度和復雜程度對數字化結果的質量有著顯著影響。數字化儀的分辨率和精度對數字化數據質量有著直接的決定性的影響。《地形圖數字化規范》規定,數字化儀的分辨率不能小于每厘米394線(約1000dpi),精度不低于0.127mm(0.005英寸)。常見數字化儀在分辨率方面通常能滿足要求,而在精度方面卻有相當一部分不能達到要求。在選擇數字化儀時要特別注意其精度指標,以滿足LIS工程的需要。數字化操作員的技能與經驗不同而引入的人為因素誤差是不同的,由于操作員視力、操作習慣,熟練程度和疲勞程度的不同,最佳采樣點位值判斷,十字絲與目標點重合程度的判斷會有一定程度的差異,影響數字化的質量。操作方式(如曲線采點方式和采點數目)也會影響數字化數據的質量。
假定各種誤差影響符合誤差傳播規律,手扶跟蹤數字化的綜合精度應按下式求得:[7]
m數=±
其中:m數表示手扶跟蹤數字化的綜合精度;m定表示工作底圖定向誤差,m儀表示數字化儀精度,m人表示人為因素誤差。
(3)、掃描數字化
掃描數字化用高精度掃描儀將圖像等掃描并形成柵格數據文件進行處理,將之轉化矢量圖形數據。規范規定:圖形定位控制點掃描誤差不大于0.1mm,相對于工作底圖,矢量化后的掃描點誤差不大于0.15mm,線劃誤差不大于0.2mm。影響掃描數字化質量的因素除原圖質量外,還包括:掃描精度、定向精度、矢量化精度損失等。
①掃描儀的分辨率和精度
掃描儀的分辨率和精度對掃描數字化質量的影響是至關重要的。因此,要根據具體情況選擇適當的掃描儀。目前,大幅面掃描儀大致有,滾筒式(drum),平板式(flatebed),直進式(directfeed)3種。這些掃描儀能夠輸出一種或多種形式柵格數據文件(二值、灰度和彩色)。
滾筒式掃描儀精度較高價格較貴,能以較高的分辨率掃描AO或更大的圖紙。
平板式掃描儀與滾筒式一樣精度高、價格貴、分辨率很高,但一般幅面不會超過A1幅面。由于平板式掃描儀幅面小,掃描后多需進行拼接,從而增加了工作難度,引入了更多的誤差源。LIS工程一般不選用這種掃描儀。
直接式掃描儀精度較低,價格也較便宜。通常能夠滿足一般LIS工程的需要。
目前,需要的大幅面掃描儀品牌有:CONTEX、VIDER、ANATECH等。
在選擇掃描儀時,應注意其是否采用硬件消藍。光學分辨率代表了掃描儀的分辨率能力,而經銷商往往只是給出插值分辨。同時,應注意掃描儀的歪斜失真,歪斜失真的大小與掃描儀的走紙方式有關。
②柵格數據矢量化的精度損失
在土地信息系統中,柵格數據與矢量數據各具特點與適用性,為了在一個系統中可以兼容這兩種數據,以便有利于進一步分析處理,常常需要實現兩種結構的轉換。
柵格的矢量轉換處理的目的,是為了將柵格數據分析的結果,通過矢量繪圖裝置輸出,或者為了數據壓縮的需要,將大量的面狀柵格數據轉換為由少量數據表示的多邊形邊界,但是主要目的是為了能將自動掃描儀獲取的柵格數據加入矢量形式的數據庫。
在柵格數據矢量的過程中的細化、跟蹤等均可能引入一些誤差。復雜圖形全自動化矢量化效果極差,會產生眾多的交叉線,導致多邊形跟蹤錯誤。對此,應采用交互式矢量化方法。因此在選擇矢量化軟件時不應僅僅關心自動化程度(全自動矢量化軟件價格往往很高)。還要特別注意是否具有以下功能:智能去斑,裁剪,扭曲較正,比例控制,水平校正,光柵編輯和交互式矢量化等。
③掃描數字化方法誤差
掃描數字化的幾何分辨率是掃描數字化方法誤差中最重要的誤差源,減小這種誤差的唯一方法就是提高掃描儀的幾何分辨率。但是,隨著分辨率的提高,柵格數據量以平方級速度增長。這往往造成計算機存儲資源耗盡,數據處理時間平方級延長。以300dpi(約每mm12個點)的分辨率掃描時,獨立點間距離的相對精度為1.4/1000左右。全自動矢量化細化過程所產生的點位誤差為1~2個像素點,而交互跟蹤矢量化最大點位誤差可以控制在一個像素點。按300dpi計,每個像素點相當于圖上0.01mm。掃描數字化綜合精度可按下式計算:
M掃=±
其中:M掃表示掃描數字化的綜合精度;M定表示底圖定向誤差;M儀表示掃描儀精度;M矢表示矢量化誤差。這里,M定取±0.12mm,按300dpi計算M儀取±0.09mm,M矢取±0.1mm。則M掃=±0.180[8]。
四、數據處理質量
土地信息系統的數據庫建立后,其中已經包含了數據源和數據庫建庫所引入的誤差。數據庫中的多源數據,經過系統的各種分析處理后,在形成新的數據和最后產品的過程中還會產生新的數據質量問題。這些問題包括:幾何改正,坐標變換和比例變換,幾何數據的編輯、屬性數據的編輯、空間分析,數據格式的轉換等。
1、空間分析
空間分析是對分析空間數據的技術的通稱。從客觀上區分,可歸納為:空間的圖形數據的拓撲運算;非空間屬性數據的運算;空間和非空間屬性的聯合運算等[9]。空間分析賴以進行的基礎是空間數據庫,土地信息系統的空間數據分析,是實現土地資源信息系統的實際運用的重點途徑。
空間分析中的疊加分析是土地信息系統中十分常用的一種分析方法,是用戶經常用以提取數據的手段之一。通過同一地區不同內容的多幅地圖的疊加組合,產生新的圖形和屬性信息。在這個過程中往往產生拓撲匹配、位置和屬性方面的數據質量問題。由于疊加時多邊形的邊界可能不完全重合,從而產生若干無意義多邊形。對這些無意義多邊形進行處理的結果往往會改變界線的位置,疊加后形成的新的多邊形的屬性值也可能存在由于屬性組合帶來的誤差。
2、坐標變換
土地信息系統數據來源較多,各種數據輸入信息系統應便于系統對數據進行圖形顯示,疊加查詢,統計分析處理。LIS要實現這些功能,一個首要和基本的前提就是各種不同來源的數據在系統內必須在一致的地形圖坐標系下。但是,在實際的數據采集過程中,大量的數據坐標并不一定屬于系統用戶所要求的坐標系,原始數據為一種坐標系,系統要求的數據為另一種地圖坐標系,有的數據坐標根本沒有地理意義,對此情況,必須提供從一種地圖坐標系到另一中坐標系的坐標變換。
在具體的操作過程中,有可能產生新的誤差。在不同比例尺下對坐標數據的重新設立產生誤差,進行投影變換和/或基準面變換時產生的誤差。生產實踐中為提高數據質量,確保系統的數據精度和可靠性,通常用仿射變換和相似變換等模型來進行數據處理,以減小或消除誤差。
坐標變換的實質是建立兩個平面點之間的一一對應關系,現有一般GIS(LIS是GIS的專題)軟件大都提供了以下兩種模型實現坐標變換。
一是仿射變換:仿射變換也稱六參數變換,其變換公式為:[10]
x´=Ax+By+C(Ⅰ)
y´=Dx+Ey+F(Ⅱ)
其中,x´、y´為地圖輸出坐標系中的坐標點對;x、y為輸入坐標中的坐標點時;A,B,C,D,E,F為方程參數。參數在坐標系空間上的幾何意義為:A和A分別確定點(x,y)在輸出坐標中x方面和y方向上的縮放尺度。B和D確定旋轉角度,C和F分別確定在x方向和y方向上的水平移尺寸。
二是相似變換:當式(Ⅰ)、(Ⅱ)中的參數滿足條件A=E=Scos@,B=-D=Ssin@時,則得到四參數的相似變換公式:
x´=Ax+By+B(Ⅲ)
y´=-Bx+Ay+D(Ⅳ)
式中,x´、y´為輸出地圖坐標系中的坐標點對;x、y為輸入地圖坐標中的坐標點對;A、B、C、D為方程參數,相似變換實質上也是坐標系間的平移,旋轉和縮放尺度的變換,式中C和D分別為坐標在x軸和y軸上的平移大小,為縮放比例,@=arctg(B/A)為旋轉角度。
為了求出以上公式中的參數,建立兩種坐標之間的仿射(或相似)轉換關系,至少需要三個(或兩個)已知的控制點坐標。而實際上,應選擇多于三個(或兩個)控制點,方能按照最小二乘法原理進行平差,得出系數值,代入上述方程即建立輸入和輸出坐標系之間的仿射(或相似)變換數學模型。
可以看出,仿射變換和相似變換都為線性函數變換模型,可實現對原圖形的平移、旋轉和縮放,相比較而言,相似變換不能進行x軸、y軸不均勻縮放的變換,而仿射變換能保證更高的數據精度。
3、數據變換
(1)CAD向GIS的轉換
目前我國土地管理中存在一個較為普遍的問題是土地信息系統的構建與圖形數據采集較少作用一個整體來通盤考慮,地籍測繪大大超前于信息管理系統構建。中小城市這種問題表現得更為突出。為滿足土地確權發證,土地定級估價等需要,1995年前測繪的地籍圖等圖件因受技術條件的限制絕大部分是采用傳統白紙測圖方法完成的。隨著計算機技術的發展和在測繪工作中的普及應用,1995年之后數字地圖逐漸取代傳統測繪。但一個不容忽視的事實是,絕大多數測繪圖軟件是在AUTOCAD上進行二次開發完成的。有些甚至是采用低版本的CAD,有些測繪圖軟件雖然測的是數字圖,但只有非編碼的圖形文件,不保留信息,或者圖形編輯以后,返不成信息。這種數字圖說到底僅僅是從傳統的白紙圖過渡到計算機驅動繪制的白紙圖。本質上與傳統測繪沒有什么區別。有些雖然采用了較高版本的CAD基礎軟件二次開發成數字測圖軟件并采用了數字編碼技術,但由于較少考慮CAD與GIS的數據共享問題(土地信息系統屬于專題GIS)。在著手考慮構建土地信息系統時,遇到的突出問題則是如何充分,有效利用已有數字信息資料,并確保數據轉換質量。
對于傳統模擬圖或難以返成信息的所謂數字圖只能采用原圖數字化,形成數字信息后方可加以利用,但其精度丟失是不可避免的。
對于采用了編碼技術,也能返成信息的數字圖,其數字信息可以通過數據轉換來實現數據共享,但由于CAD與GIS圖形數據之間其數據格式,數據內容甚至數據概念都有很大差異,數據轉換時應注意以下三個方面:[11]①數據格式轉換。不同的軟件有不同的數據格式,有些可以通過通用數據格式如DXF實現轉換,但轉換過程中的數據丟失也的確令人煩惱。②數據元素轉換。CAD與GIS兩者之間的圖形元素不是一一對應關系,CAD圖形中的圖形元素種類要比GIS圖形文件中的圖形元素種類多,GIS中只有點、線、面三類基本圖形元素,而CAD中包括有點、線、面、注記、矩形等多種圖形元素,在具體轉換中,CAD的圖形元素哪些轉換成GIS的點,哪些元素轉換面面,什么元素需要轉換成GIS的屬性數據,什么元素則不需要轉換到GIS中去等。CAD與GIS圖形元素之間的對應關系,都需要認真細致地加以技術處理,使空間數據和屬性數據在輸入系統后正確地連接起來。③拓撲關系的形成。因為CAD的圖形元素之間沒有拓撲關系,實現CAD向GIS數據轉換的一個重要內容就是要將轉換后的圖形數據按照一定的技術要求經過編輯,在GIS環境下建立幾何元素的拓撲關系。
在實際轉換中,還會出現許多意想不到的技術問題,會影響數據轉換質量,有待進一步解決。
(2)矢量數據結構向柵格數據結構的轉換
土地信息系統的建設中,許多數據如行政邊界,交通干線,土地利用類型、土壤類型等都是用矢量數字化的方法輸入計算機或以矢量的方式存在計算機中,表現為點、線、多邊形數據。然而,矢量數據直接用于多種數據的復合分析等處理將比較復雜,特別是不同數據要在位置上一一配準,尋找交點并進行分析。相比之下利用柵格數據模式進行處理則容易得多。加之土地覆蓋的疊置復合分析更需要把其從矢量數據的形式轉變為柵格數據的形式。
矢量數據的基本坐標是直角坐標(x,y),其坐標原點一般取圖的左下角。網格數據的基本坐標是行和列(i,j),其坐標原點一般取圖的左上角。兩種數據變換時,令直角坐標x和y分別與行與列平行。由于矢量數據的基本要素是點、線、面,因而只要實現點、線、面的轉換,各種線劃圖形的變換問題基本上都可以解決[12]。
矢量數據變成柵格數據的原理與方法并不困難,但由于矢量數據的記錄方式各不相同,也會產生一些問題。如多邊形之間公共邊原來只有一條交界線,轉變成網格后成為有一定寬度的界線,產生了一定的近似性。特別是幾條線交叉處,一個網格元素中包括了相鄰的幾種類別,轉換時只能用其中的一種類別作為交叉點所在的元素的類別,這種誤差應在允許的范圍以內。而減小網格尺寸,雖提高了精度,但大大提高了數據的冗余量。
柵格數據結構需要大量的計算機內存來存貯和處理數據,才能達到與矢量數據結構相同的空間分辨率,而矢量結構在某些特定形式的處理中,如象多邊形疊置,空間均值處理等尚有大量的技術問題來解決。值得注意的是,無論采用哪種轉換方法,轉換的結果都會不同程度地引起原始信息的損失。
通過矢量數字化或掃描數字化所獲取的原始空間數據,都不能避免地存在錯誤或誤差。屬性數據在建庫時,也難免會存在錯誤。諸如:空間數據的不完整或重復,空間點、線、面數據的丟失或重復,區域中心點的遺漏,柵格數據矢量化時引起的斷線等,空間數據位置的不準確、線段過長或過短,線段的斷裂、相鄰多邊形結點的不重合及空間數據的變形等。因此,必須對圖形數據和屬性數據進行一定的編輯。
土地信息系統數據編輯是消耗時間的交互處理工作,對空間數據不完整或位置的誤差,主要是利用LIS圖形編輯功能,如刪除(目標、屬性、坐標),修改(平移、拷貝、連接、分裂、合并、裝飾)、插入等進行處理。對空間數據比例尺的不準確和變形,可以通過比例尺變換和糾正來處理。
在數據的編輯過程中,由可能產生一些新的問題。如:線段的相關與延伸出現的問題,圖形的平移與旋轉出現的問題,刪除“細部多邊形”時產生的誤差,數值計算與變化的誤差;文件的合并以及形成新文件的問題;屬性數據的重新定義和更新的問題。有的問題時可能避免的,有的問題則無法避免。因此,必須進行檢核。通過耐心細致的檢查,主要誤差都能從數據中尋找出來,并有效消除誤差。一般采用疊合比較法,目視檢查法和邏輯法。
疊合比較法是空間數字化正確與否的最佳檢核方法,按與原圖相同的比例尺把數字化的內容繪在透明材料上,此后與原圖疊合在一起,在透光桌上仔細的觀察和比較。一般。對于空間數據的比例尺不準確和空間數據的變形馬上就可以觀察出來,對于空間數據的位置不完整和不準確則須把遺漏、位置錯誤的地方明顯地標注出來。目視檢查指在屏幕上用目視檢查的方法,檢查一些明顯的數字化誤差與錯誤,包括線段過長或過短,多邊形的重疊和裂口、線段的斷裂等。
5、由計算機引起的問題
在計算機中,數據是由一定字長的編輯數碼表示的,由計算機字長可能引起一種誤差。這種誤差出現在各種數值運算和模型分析中,由這種誤差引起的問題很多[13],例如LIS空間數據庫中整數編碼對面積和周長計算的影響,比例尺變換和旋轉變換對拓撲關系的影響等。削弱誤差影響的主要方法有:改變數據在計算機中的表示方式,采用合適的算法等。
除了數據處理精度外,數據存儲精度也與計算機字長有關。16位的計算機在存儲低分辨率的柵格圖像時不會出現問題,但存儲高精度的控制點坐標或點位精度要求高的地理數據時,則不能勝任。
五、數據應用質量
土地信息數據在使用過程中往往出現一些質量問題,這些問題包括數據的完備程度,時間的有效性,拓撲關系的正確等。
1、數據的完備程度
數據的完備程度指地理數據在范圍、內容、及結構方面滿足所有要求的完整程度。包括數據范圍、空間實體類型、空間關系分類、屬性特征分類等方面的完整性。
一般來說,空間范圍越大,數據的完整性就越差。在土地信息系統的建庫過程中,數據不完整最簡單的例子是缺少數據。如計算機從GPS接收機傳輸位置數據時,由于軟件受干擾或其它因素的緣故,只記錄下經度而丟失緯度,以至造成數據不完整。另外由于GPS接收機無法收到四顆或更多的衛星信號而無法計算高程數據也會造成數據的不完整。又如某個應用項目需要1:5000的基礎底圖,但現在的地圖數據只覆蓋項目區的一部分,底圖數據便不完整。
在土地信息系統底建庫中,涉及大量的地籍檔案。地籍檔案來源于土管機關的地籍部門,數量大、形式多、浩繁、零亂,隨著時間地推移,以及人為和自然的各種因素地影響,有可能遭到損壞。如檔案老化,書寫材料低劣、地籍檔案變到污染,變色、蟲蛀等現象,進而影響到整個系統的質量。
2、數據的現勢性
數據的現勢指數據反映客觀現象目前狀況的程度。數據的現勢差,反映的客觀現象就可能不準確。不同現象的變化頻率是不同的。如地形的變化一般來說比人類建設要緩慢,地形可能會由于山崩、雪崩、泥石流、人工挖掘及填海等原因而在局部區域改變。但由于地圖制作周期較長,局部的變化往往不能及時地反映在地形圖上,對那些變化較快的地區,地形圖就失去了現勢性。城市地區土地覆蓋變化較快,這類地區土地覆蓋圖的現勢性就比發展較慢的農村地區會差些。地形圖上記錄著所用航空像片獲得的年代。若又用其他數據進行過修改(一般是較新的航空像片),也應記錄于上。
在土地信息系統建庫中,要求地籍信息和地籍圖必須具有現勢性。地籍信息變更比較頻繁,如土地利用類型,權屬或宗地的重劃,合并等。由于受自然因素和人為作用的影響,土地資源的數量、質量、分布和使用情況都處在經常變化之中。基于這一特點,土地管理部門提供的數據很難保證現勢性,這也是影響數據質量的一個重要方面。
3、拓撲關系
在LIS中,為了真實地反映地理實體,不僅要包括實體的位置、形狀、大小和屬性,還包括必須反映實體之間的相互關系,這些關系就是指它們之間的鄰接關系,關聯關系和包含關系,拓撲關系。拓撲關系的核心是建立點、線、面的關聯關系。通常有以下幾種空間關系:點-點關系、點-線關系、點-面關系、線-線關系、線-面關系、面-面關系。空間數據的拓撲關系,對數據處理和空間分析具有非常重要的意義[14]。
利用拓撲關系,可以確定一種空間實體相對于另一種空間實體的位置關系。利用拓撲關系,可以確定某縣有多少耕地,分析土地利用類型及對土地適宜性做出評價等。
在拓撲關系的建立中,拓撲過程中伴隨有數據所表達的空間特征的位置坐標的變化,拓撲關系的不正確等情況,導致空間分析的結果錯誤,給土地管理決策帶來一定的影響。
六、結論
數據是LIS最基本和最重要的組成部分,同時也是一個LIS項目中投資比重最大的一個部分。數據質量的好壞,會直接影響到LIS的系統功能和應用質量問題的三個方面(數據源的質量問題、數據處理質量問題、數據應用質量問題)著手,對LIS的數據質量問題進行了一定的歸納總結和初步的探討。眾所周知,LIS的數據質量是影響LIS的一個瓶頸環節,LIS數據量大、數據種類多、數據結構復雜。因此,在LIS的建設過程中,如何在數據采集與建庫中實施質量控制,保證數據質量對土地信息系統建設來說顯得尤為關鍵。
七、總結與體會
畢業論文的撰寫是一次再學習和鍛煉的機會,是對所學知識的一個融會貫通的過程。通過畢業論文的撰寫,我對所學的知識有了更深層次領悟和掌握,對自己所學的土地管理專業有了一個整體認識。畢業論文不僅是對所學知識的總結,也是運用所學知識探求新知的方法、手段。既是一次再學習的過程,也是一次深入學習的機會。同時,畢業論文寫作,為今后的學習工作奠定了一定的基礎。通過畢業論文的寫作,我真正懂得理論聯系實際的重要性。在撰寫畢業論文中,我運用所掌握的基本知識、方法和技能,研究探討了土地信息系統建立過程中數據質量的有關問題。通過畢業論文的撰寫,我進一步完善了自己的知識結構,學習了更多的知識。不僅如此,我對土地信息系統數據質量控制措施與方法方面有了更進一步的認識。
通過畢業論文的寫作,不僅強化了我的學習素質、研究素質和創業素質,而且培養了我的創新意識,激發了我探求新知的欲望。認真寫作畢業論文,不僅能進一步鞏固所學的理論知識,而且還能進一步提高自己的各項基本技能,實踐能力和解決問題的能力。
八、謝辭
在論文的寫作過程中,玉文龍老師給予了很大的支持和幫助,為論文的寫作提出了許多寶貴性的意見和建議;在他的指導下,這篇論文得以順利完成。在資料的搜集過程中,圖書館工作人員為我們提供了很大幫助,本組同學也給予了很多支持,在此表示衷心感謝。
參考文獻
[1]錢樂祥,余明全.土地信息系統的幾個基本問題.測繪通報,1999(10).
[2]張超等.地理信息系統.北京:高等教育出版社,1995.
[3]閻正等.城市地理信息系統標準化指南.北京:科學出版社,1998.
[4]范愛民,景海濤.地圖數字化質量問題.測繪通報,2000(4).
[5]嚴星,林增杰.地籍管理.北京:中國人民大學出版社,1999
[6]-[7]郝向陽等.地圖掃描數字化點位精度分析.測繪學報,1995,25(1).
[8]毛鋒等.地理信息系統建庫技術及應用.北京:科學出版社,1999.
[9]湯國安,趙牡丹.地理信息系統.北京:科學出版社,2000.
[10]徐建剛.城市規劃信息技術開發及應用.南京:南京大學出版社,2000.
[11]司少先.地籍信息系統源數據質量問題探討.測繪通報,1999(4).
[12]邊馥苓主編.GIS原理與方法.北京:測繪出版社,1996.
0前言
隨著現代商業經濟和信息技術的發展,商業信息的增長速度呈現指數上升,積累了海量的、以不同形式存儲的商業數據資料,原有的決策支持系統(DSS)和領導執行系統(EIS)已不能滿足需要,這時出現數據挖掘技術,它能夠去粗存精、去偽存真,從海量的商業信息中提取知識和有用信息的技術。現代信息技術處理商業信息經過一定的發展,逐步形成現在的商業數據挖掘技術。
1.數據挖掘方法在商業信息中應用的規則
數據挖掘技術在商業中的應用主要基于AI、機器學習、統計學等技術,高度自動化地分析商業原始數據,做出歸納性的推理,從中挖掘出潛在的模式,預測客戶的行為,幫助商業決策者調整市場策略,減少風險,做出正確的決策,體現一種決策支持過程。
1.1商業信息泛化、簡約和特征提取規則。商業信息泛化是為了商業數據更好的理解和掌握,將其具體一般的數據信息抽象到較高層次的過程;商業信息簡約是為了采用一定的手段對信息進行描述;商業信息特征是找出這些信息的共同特征,尋找信息的通用性特征式。
1.2商業信息分類技術規則。商業信息分類是按照一組商業信息對象的特征給出信息對象劃分的過程。其目的是學會一個分類函數或分類模型,該模型能把數據庫的數據信息項映射到給定類別中的某一個。
1.3商業信息的聚類規則。聚類規則是識別一組信息對象的內在規則,從而將對象分組,構成相似的對象類,從而找出數據信息的分布規律,并進一步去發現隱含在一組混雜的數據信息集里的分類規則。聚類是把一組個體按照相似性歸類,即"物以類聚"。使屬于同一類別的個體之間的距離盡可能小,而不同類別的個體間的距離盡可能大。
1.4商業信息的關聯規則。關聯規則的商業數據挖掘已經從單一概念層次的關聯規則發展到多概念層次的關聯規則的發現。關聯規則是如下的一種規則:"我們在研究大型商場的顧客在購買上衣和褲子的時候,發現其中在這些顧客中有10%的顧客同時買了帽子(上衣+褲子+帽子),這就形成簡單的關聯規則。除了具有上述關聯規律,還有時間或序列上的規律,在不同的時間(春夏秋冬)所購的衣服、褲子以及帽子是不相同的,并且不同層次或者不同年齡的人所購商品又有一定的規律性。
2.數據挖掘技術在商業信息中的應用
數據挖掘技術是目前在商業信息處理中應用的比較多的一項技術,為了在商業領域中對海量數據庫和大量復雜信息中提取有價值的知識,進一步提高信息的利用率,對公司及時制定相應的對策有非常重要的意義,在這里,討論幾個主要商業行業中的商業信息處理。
2.1數據挖掘技術在電子商務網站數據中的應用
隨著Web技術的發展,電子商務網站正在成為現在商家的必爭之地。如何讓電子商務網站有效益要想有效益就必須吸引客戶,增加能帶來效益的客戶忠誠度。電子商務網站每天都可能有上百萬次的在線交易,生成大量的記錄文件和登記表,如何對這些數據進行分析和挖掘,充分了解客戶的喜好、購買模式,甚至是客戶一時的沖動,設計出滿足于不同客戶群體需要的個性化網站,進而增加其競爭力,幾乎變得勢在必行。若想在競爭中生存進而獲勝,就要比您的競爭對手更了解客戶。
在對網站進行數據挖掘時,所需要的數據主要來自于兩個方面:一方面是客戶的背景信息,此部分信息主要來自于客戶的登記表;而另外一部分數據主要來自瀏覽者的點擊流,此部分數據主要用于考察客戶的行為表現。但有的時候,客戶對自己的背景信息十分珍重,不肯把這部分信息填寫在登記表上,這就會給數據分析和挖掘帶來不便。在這種情況之下,就不得不從瀏覽者的表現數據中來推測客戶的背景信息,進而再加以利用。就分析和建立模型的技術和算法而言,網站的數據挖掘和原來的數據挖掘差別并不是特別大,很多方法和分析思想都可以運用。所不同的是網站的數據格式有很大一部分來自于點擊流,和傳統的數據庫格式有區別。因而對電子商務網站進行數據挖掘所做的主要工作是數據準備。
2.2數據挖掘技術可以用在金融領域的應用
金融事務需要搜集和處理大量數據,對這些數據進行分析,發現其數據模式及特征,然后可能發現某個客戶、消費群體或組織的金融和商業興趣,并可觀察金融市場的變化趨勢。
數據挖掘在銀行信息中的應用。商業銀行業務的利潤和風險是共存的。為了保證最大的利潤和最小的風險,必須對賬戶進行科學的分析和歸類,并進行信用評估,利用數據挖掘工具,可以根據客戶的消費模式預測何時為客戶提供何種產品。銀行如何讓一家新開的銀行網點實現快速贏利呢?銀行結合了GPS推理信息系統和商業智能應用系統,在銀行的客戶信息中,詳細記錄有客戶的常駐地,并且,當銀行客戶到該銀行網點辦理業務時,銀行商業智能系統將自動記錄客戶的操作信息,以及銀行網點地址信息。經過大量的記錄,客戶的常駐地到銀行網點的行動路線,將被通過數據分析而得出。大量的客戶路線得出后,我們可能會發現,某個地區進行銀行業務操作的客戶特別多,但他們附近沒有銀行網點,而是要到離他們較遠的地方去辦理,于是銀行就決定在這個地區開辦一個銀行網點。
數據挖掘在證券信息中的應用。上市公司定期公布的財務報告具有很強的信息含量,但是當期會計盈余數據的信息會在披露前后在股票市價中迅速得以體現。因此對于中長期投資者來說,重要的是預見未來。質地優良且未來具有較高盈利增長能力的公司是中長期投資者(包括普通投資者,證券投資基金和券商)普遍關注的對象,因為只有這類公司才能給投資者帶來持續的回報。而財務報告包含了大量描述公司經營狀況的數據。這些數據應能為投資者提供關于公司未來盈利能力的信息。對于中長期投資者而言,需要做的就是利用這些信息挖掘出未來能夠具有較高盈利水平同時又具有較好的成長性公司。采用數據挖掘技術來發掘這些財務報告中是否包含關于公司未來盈利情況的信息,獲得較精確的預測效果,選出的投資組合能否獲得超額收益,這對于投資者來說是非常重要的。
2.3數據挖掘技術在企業市場營銷中的應用
數據挖掘技術在企業市場營銷中得到了比較普遍的應用,它是以市場營銷學的市場細分原理為基礎,其基本假定是"消費者過去的行為是其今后消費傾向的最好說明"。通過收集、加工和處理涉及消費者消費行為的大量信息,確定特定消費群體或個體的興趣、消費習慣、消費傾向和消費需求,進而推斷出相應消費群體或個體下一步的消費行為,然后以此為基礎,對所識別出來的消費群體進行特定內容的定向營銷,這與傳統的不區分消費者對象特征的大規模營銷手段相比,大大節省了營銷成本,提高了營銷效果,從而為企業帶來更多的利潤。這些來自各種渠道的數據信息被組合,應用超級計算機、并行處理、神經元網絡、模型化算法和其他信息處理技術手段進行處理,從中得到商家用于向特定消費群體或個體進行定向營銷的決策信息。4數據挖掘技術在民用通信部門中的應用
我國各種民用通信用得最多的國家之一,為了分析出那一類收費對應那類層次的人群,我們就可以利用數據挖掘技術,把當前電信消費者的數據進行收集、分析、總結,制定出有效的管理辦法,這既有利于公司又有利于客戶的優惠政策,這樣能夠及時發現問題,減少顧客流失,為通信公司挽回損失。數據挖掘在通信部門中體現在三個方面:(1)客戶挽留解決方案;(2)電信業客戶細分解決方案;(3)電信業交叉銷售和提升銷售解決方案。這三個項目的實施,可以為民用通信部門解決三個決策問題:第一,預測哪些客戶最具有流失的傾向以及影響客戶流失的關鍵因素,通過預制的分析模型提供"流失記分"幫助識別風險客戶,在客戶流失之前采取針對性措施來挽留他們。第二,根據客戶可能的行為和潛在的盈利性對客戶進行分類,制定更準確的產品組合、更準確的產品介紹和產品捆綁服務。第三,從現有客戶中識別出有可能接受交叉銷售和提升銷售的客戶人選,評估客戶過去的購買模式,預測客戶下一步可能購買什么。
1.1適應企業資源管理集約化和工作效率提升的需要
在整個工程建設過程中,人力資源的需求是不均衡的,而且每個階段所需要的工種也不盡相同。因此常常會出現有些項目某一時期人員相對過剩,而有些項目卻苦于找不到人。在企業發展規模快速擴張時期,人力資源的集約化管理已是迫在眉睫。物資集中采購是大型企業的通常做法,這也是企業“以量換價”降低成本的有效方法。大量物資從對外采購到對內各個項目的供應,期間還要實現大批材料間的合理串換以及設備間的合理調配等資源管理工作,僅僅依靠精密的計劃是不夠的,建設工程受施工環境、政策等多種因素影響,有時一拖就是幾年(例如一個拆遷問題就可能影響一個工程多年)。因而充分集約企業有效資源,提高資源的利用率,降低企業成本,已成為企業管理創新的主要方向。基于“大數據”信息化平臺的工程管理體系可為解決這一問題提供正確、可行的方法。
1.2適應企業流程化和標準化管理的需要
傳統的施工企業技術管理強調技術創新、工法研究、論文編寫以及對工程現場技術問題的處理等。相對而言對技術的傳承、積累、技術人才的培訓工作做得不夠,很難形成具有企業特點的技術資源庫。新員工常常連基本的表格填寫都弄不明白,更無法談及熟練掌握核心技術要點。同時隨著企業規模的迅速擴張,企業的管理人員數量增長遠遠不及規模的增長。為了加強控制、保障效益,企業不得不提高流程化、標準化管理要求。但隨之而來的問題卻是由于數據不能共享,員工的重復工作大幅增加,且數據錯漏頻多。以大數據技術思維創新技術體系的管理方式和內容,變革施工企業的管理模式,是適應互聯網時代企業管理革命的迫切需要。
2基于“大數據”的工程管理體系建設的主要思路和框架
2.1基于“大數據”的工程管理體系建設的思路
基于大數據的工程管理體系構建的思路是:用大數據的思維構建工程管理體系,是將工程管理全過程數據(并非只是樣本數據)進行歸集、分類,然后通過互聯網在系統內進行共享和處理,實現思維共享,實現工程管理的系統化、系統運行的流程化、流程控制節點的表單化。用數據驅動系統建設,用數據應用的新要求推動數據積累,數據流動推動管理流程化運行,數據的變異推動監管系統的完善。
2.2基于“大數據”信息化平臺的主體框架
基于“大數據”的信息化平臺主要包括“大數據”庫與工程管理系統兩部分,相對于現有的工程管理軟件,其核心是集成了企業管理經驗的數據庫,信息平臺的開發是工程技術人員主導開發,強化了現場管理的主要控制點,適用性強。“大數據”庫收集了工程管理過程中所形成的諸如技術、質量、安全、成本等方面的各類基礎數據,為了便于數據歸類及查詢,分別建立了技術質量數據、成本管理數據、安全管理數據三個子數據庫。工程管理系統是針對項目而建立,實現對項目進度、質量、成本、安全的過程管控。它包括四個子系統:項目綜合管理、技術質量管理、成本過程管理及安全生產管理。
3工程管理系統建設的基本要求、主體功能及主要特點
3.1基本要求
(1)便于訪問和查詢
“大數據”庫不僅應滿足對企業全過程、全方位所形成的數據信息進行及時收集、分類儲存,便于分析處理,而且應能與工程管理系統實現有效鏈接,便于對信息數據的訪問及查詢。
(2)實現對工程項目的高效管控
該系統能夠對工程項目全過程、全方位進行遠程管控,實現項目質量、安全、成本、進度等子系統的無縫對接,使管控指令及時下達,并迅速獲得反饋信息,實時對項目執行效果進行評價。
(3)硬件設施能滿足系統運行以及擴展的需要
企業中心服務器、網絡傳輸帶寬及數據采集終端必須滿足系統運行,并且應預留出足夠的擴展空間以適應系統持續改進的需要。
3.2主體功能
(1)實現項目的動態管理
該系統通過“大數據”庫與管理系統的互動功能,從項目合同簽訂伊始到項目竣工結束,建立項目質量、安全、進度、成本的動態數據庫,實現項目質量、安全、成本、進度等子系統的無縫對接和遠程管控。
(2)實現標準化和系統化管理
該系統為資料編寫流程、收集要求、操作人員行為規范、樣表和示范文本等資料的標準化管理提供了依據,管理過程中所形成的資料實時歸集、分類存儲,確保資料的完整性、準確性和系統性。
(3)提供咨詢服務和培訓指導功能
數據庫中的樣本、范本、各種說明要求按照國家及行業現行規范進行編制,管理過程中形成的經驗數據、方法等經過提煉與總結達到行業先進水平。企業管理人員通過便捷的查詢和借鑒,能夠快速了解和熟悉自身業務,從而不斷提高綜合管理素質。
(4)提供即時交流互動平臺
該系統搭設了網上溝通交流互動平臺,提供了企業員工相互間進行經驗交流、問題探討的通道,并能借助企業內、外專家庫鏈接窗口,實現對各專業疑難問題(如技術難題、成本組價)的實時快速處理,并與手機聯動,確保溝通的及時性、有效性。
3.3主要特點
(1)總結經驗形成技術核心競爭力
將企業歷年來在工程管理中所形成的各類數據(包括技術方案、質量管控技術方法、工法、成本參數等),根據新的管理系統要求,重新進行收集、分析、整理,數據庫與管理系統之間統一協調。同時通過系統運行,將外部先進知識和企業不斷發展形成的新知識充實到數據庫中,實現對現有數據的更新,確保數據的先進性。
(2)簡化管理工作
數據庫中存儲了各類工作表格、表單、樣本,包括記錄工程實體質量的資料表格、進行安全管理的臺帳表格、收集進度數據的統計表格、控制成本的消耗表格等,并且每種表格在何時進行填報,如何進行填報,數據庫中均有模板及說明,工程管理人員只需要結合工程實際進行填報,數據交由信息化管理中心進行處理、反饋,大大減少管理中的重復勞動,分工更加明確,管理工作得以簡化。
(3)樣本模板標準化和信息的集中處理降低對一線員工的要求
系統中的每個管理節點,其具體工作的相關要求均按照國家、地方、行業的管理標準,結合企業的管理流程,編制了大量的樣本文件和模板,并對每項工作要錄入的數據作出明確規定。對一線每個崗位的要求就是做到數據錄入的及時性與正確性,而信息處理則集中在公司各職能部門或外包單位。弱化了對一線員工的技術要求,使其將更多精力投入到現場生產及管理中。
(4)通過平臺數據流動實現資源的集約化管理
通過運用“大數據”信息化平臺進行工程管理是對原有管理思路及管理路徑的突破。原有的管理路徑是點對點的單線程管理,例如:技術問題→技術部→總工程師,成本問題→成控部→總經濟師,技術數據與成本數據在總工程師與總經濟師之間發生交互,降低了管理效率,采用信息化的管理后,由于信息化平臺的介入,使得多個職能部門間能夠并行管理,數據交互可發生在任何時間及地點,提高了數據利用率。利用互聯網及信息化平臺使管理路徑中存在了共享機制,平臺及時了各類資源信息,包括設備、人力資源、材料、勞動力等,管理人員可通過平臺調用、查詢各類數據(人員、物資、技術資源等),實現資源共享。例如某個工地剛進場一臺設備,這臺設備的各類參數就會即時在內網上公布,設備資源庫為設備管理人員提供全公司所有設備資源性能參數及其分布。同樣對于材料資源,優秀的分供商信息隨時都會公布在內網上,資源利用充分而有效。
(5)建立交互式平臺系統及時糾偏
通過系統建設再造了企業決策層和管理層、管理層之間、管理層與執行層的運行流程。以流程運行為主線路,各管理節點將數據處理信息到交互式平臺,使執行部門的數據及時傳遞到相應的監督和管理部門,例如材料部門是依據成控部和項目部在工程開工前提供的材料計劃進行供應,而當項目的材料供應需求偏離計劃時,材料部門會及時對項目部提出預警,及時糾偏,進一步規范流程運行。
4結論