Hive創建内部表時,會将數據移動到數據倉庫指向的路徑。創建外部表時,僅記錄數據所在的路徑,不對數據的位置做任何改變,在删除表的時候,内部表的元數據和數據會被一起删除,而外部表隻删除元數據,不删除數據。這樣外部表相對來說更加安全些,數據組織也更加靈活,方便共享源數據。
需要注意的是傳統數據庫對表數據驗證是寫時模式,而Hive在load時是不檢查數據是否符合schema的,Hive遵循的是讀時模式,隻有在讀的時候Hive才檢查解析具體的數據字段。
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!