摘要:討論了Web數(shù)據(jù)挖掘中的數(shù)據(jù)異構(gòu)問題,通過xML技術(shù)建立了一個半結(jié)構(gòu)化數(shù)據(jù)模型和一個自動抽取模型,以解決Internet上絕大多數(shù)因異構(gòu)、非結(jié)構(gòu)化、動態(tài)數(shù)據(jù)集成問題所導(dǎo)致的web數(shù)據(jù)挖掘的困難。
關(guān)鍵詞:Html技術(shù);XML技術(shù),web數(shù)據(jù)挖掘;數(shù)據(jù)異構(gòu)