㈠ 數據挖掘部是做什麼的
分析方法:
數據挖掘
· 分類 (Classification)
· 估計(Estimation)
· 預測(Prediction)
· 相關性分組或關聯規則(Affinity grouping or association rules)
· 聚類(Clustering)
· 描述和可視化(Description and Visualization)
· 復雜數據類型挖掘(Text, Web ,圖形圖像,視頻,音頻等)
方法簡介:
·分類 (Classification)
首先從數據中選出已經分好類的訓練集,在該訓練集上運用數據挖掘分類的技術,建立分類模型,對於沒有分類的數據進行分類。
例子:
a. 信用卡申請者,分類為低、中、高風險
b. 故障診斷:中國寶鋼集團與上海天律信息技術有限公司合作,採用數據挖掘技術對鋼材生產的全流程進行質量監控和分析,構建故障地圖,實時分析產品出現瑕疵的原因,有效提高了產品的優良率。
注意: 類的個數是確定的,預先定義好的
· 估計(Estimation)
估計與分類類似,不同之處在於,分類描述的是離散型變數的輸出,而估值處理連續值的輸出;分類
數據挖掘
的類別是確定數目的,估值的量是不確定的。
例子:
a. 根據購買模式,估計一個家庭的孩子個數
b. 根據購買模式,估計一個家庭的收入
c. 估計real estate的價值
一般來說,估值可以作為分類的前一步工作。給定一些輸入數據,通過估值,得到未知的連續變數的值,然後,根據預先設定的閾值,進行分類。例如:銀行對家庭貸款業務,運用估值,給各個客戶記分(Score 0~1)。然後,根據閾值,將貸款級別分類。
· 預測(Prediction)
通常,預測是通過分類或估值起作用的,也就是說,通過分類或估值得出模型,該模型用於對未知變數的預言。從這種意義上說,預言其實沒有必要分為一個單獨的類。預言其目的是對未來未知變數的預測,這種預測是需要時間來驗證的,即必須經過一定時間後,才知道預言准確性是多少。
相關性分組或關聯規則
(Affinity grouping or association rules)
決定哪些事情將一起發生。
例子:
a. 超市中客戶在購買A的同時,經常會購買B,即A => B(關聯規則)
b. 客戶在購買A後,隔一段時間,會購買B (序列分析)
· 聚類(Clustering)
聚類是對記錄分組,把相似的記錄在一個聚集里。聚類和分類的區別是聚集不依賴於預先定義好的類,不需要訓練集。
例子:
a. 一些特定症狀的聚集可能預示了一個特定的疾病
b. 租VCD類型不相似的客戶聚集,可能暗示成員屬於不同的亞文化群
聚集通常作為數據挖掘的第一步。例如,"哪一種類的促銷對客戶響應最好?",對於這一 類問題,首先對整個客戶做聚集,將客戶分組在各自的聚集里,然後對每個不同的聚集,回答問題,可能效果更好。
· 描述和可視化(Description and Visualization)
是對數據挖掘結果的表示方式。一般只是指數據可視化工具,包含報表工具和商業智能分析產品(BI)的統稱。譬如通過Yonghong Z-Suite等工具進行數據的展現,分析,鑽取,將數據挖掘的分析結果更形象,深刻的展現出來。
挖掘分類
以上七種數據挖掘的分析方法可以分為兩類:直接數據挖掘;間接數據挖掘·
直接數據挖掘
目標是利用可用的數據建立一個模型,這個模型對剩餘的數據,對一個特定的變數(可以理解成資料庫中表的屬性,即列)進行描述。
間接數據挖掘
目標中沒有選出某一具體的變數,用模型進行描述;而是在所有的變數中建立起某種關系 。
· 分類、估值、預言屬於直接數據挖掘;後四種屬於間接數據挖掘
㈡ 上海天律信息技術有限公司 怎麼樣
這家公司其實真的不怎麼樣,老闆是一個海龜叫獸,不知道肚子里到底有沒有真學問,我是在裡面工作過的,老闆就是一個字,榨乾你為止。一定要把你榨乾為止,他的弟弟是裡面的網管,說的直接點就是看你們做事勤快不勤快的,一個會計是個騷包,估計天天都想被人干,總之就是一個垃圾的公司,請謹慎!
㈢ 國內做數據挖掘的有哪些公司
北京九辰科技有限公司就是做這行的。
㈣ 黃暉的黃暉簡介
黃暉,1959年2月生,教授1980年畢業於湖北師范學院外語系,留校任教;1983年考入北京外國語學院英語系研究生班;1986年獲文學碩士學位;1986-1987年任教於清華大學外語系;1987年考入北京外國語學院讀博士研究生,導師為許國璋教授;1989年赴美留學,就讀於美國北卡羅萊納大學信息社會學專業;1993年獲碩士學位;1996年獲博士學位.1996-2000年任美國魯汶大學教授,並獲終身教授資格;2000-2001年任美國安達信咨詢公司IT咨詢部經理.曾任美國MBNA銀行數據挖掘顧問、美國FirstUSA銀行數據挖掘咨詢顧問、美國醫學科學院數據挖掘咨詢顧問、美國特種機械製造商JohnDeere公司數據挖掘咨詢顧問.2001年回國,創辦上海社會科學院互聯網研究中心並擔任中心主任.2001年12月創辦上海天律信息技術有限公司,擔任董事長兼總經理,成功研製出中國第一套大型數據挖掘和統計分析軟體-馬克威分析系統,填補了國家空白。2002年獲上海市人才發展獎.2003年當選中國僑聯華商會常務理事.2004年當選上海市信息學會會長2004年當選「上海市科技領軍人物」2005年當選「長三角創新精英人物」2007年獲得「中國商業智能領軍人物」
㈤ 數據挖掘用什麼軟體,求軟體名稱加下載地址!
weka是一個不錯的開源的基於java寫的數據挖掘軟體,裡面很多的演算法直接可以使用,同時你也可以利用這些java包進行二次開發。http://www.cs.waikato.ac.nz/ml/weka/是其官方網站,裡面可以下載最新的weka供你使用。
sql server也是一個不錯的數據挖掘軟體,但是貌似只有開發版的才有這個功能。所以要去找開發版進行下載,verycd上面很多資源可供下載。希望能幫到你。
㈥ 什麼是數據挖掘,簡述其作用和應用。
1)數據挖掘能做以下七種不同事情(分析方法): 數據挖掘· 分類 (Classification) · 估值(Estimation) · 預言(Prediction) · 相關性分組或關聯規則(Affinity grouping or association rules) · 聚集(Clustering) · 描述和可視化(Description and Visualization) · 復雜數據類型挖掘(Text, Web ,圖形圖像,視頻,音頻等) 2)數據挖掘分類 以上七種數據挖掘的分析方法可以分為兩類:直接數據挖掘;間接數據挖掘 · 直接數據挖掘 目標是利用可用的數據建立一個模型,這個模型對剩餘的數據,對一個特定的變數(可以理解成資料庫中表的屬性,即列)進行描述。 · 間接數據挖掘 目標中沒有選出某一具體的變數,用模型進行描述;而是在所有的變數中建立起某種關系 。 · 分類、估值、預言屬於直接數據挖掘;後三種屬於間接數據挖掘 3)各種分析方法的簡介 · 分類 (Classification) 首先從數據中選出已經分好類的訓練集,在該訓練集上運用數據挖掘分類的技術,建立分類模型,對於沒有分類的數據進行分類。 例子: a. 信用卡申請者,分類為低、中、高風險 b. 故障診斷:中國寶鋼集團與上海天律信息技術有限公司合作,採用數據挖掘技術對鋼材生產的全流程進行質量監控和分析,構建故障地圖,實時分析產品出現瑕疵的原因,有效提高了產品的優良率。 注意: 類的個數是確定的,預先定義好的 · 估值(Estimation) 估值與分類類似,不同之處在於,分類描述的是離散型變數的輸出,而估值處理連續值的輸出;分類 數據挖掘的類別是確定數目的,估值的量是不確定的。 例子: a. 根據購買模式,估計一個家庭的孩子個數 b. 根據購買模式,估計一個家庭的收入 c. 估計real estate的價值 一般來說,估值可以作為分類的前一步工作。給定一些輸入數據,通過估值,得到未知的連續變數的值,然後,根據預先設定的閾值,進行分類。例如:銀行對家庭貸款業務,運用估值,給各個客戶記分(Score 0~1)。然後,根據閾值,將貸款級別分類。 · 預言(Prediction) 通常,預言是通過分類或估值起作用的,也就是說,通過分類或估值得出模型,該模型用於對未知變數的預言。從這種意義上說,預言其實沒有必要分為一個單獨的類。預言其目的是對未來未知變數的預測,這種預測是需要時間來驗證的,即必須經過一定時間後,才知道預言准確性是多少。 例子: 海南航空引入領先的數據挖掘工具馬克威分析系統,分析客流、燃油等變化趨勢,以航線收益為主題進行數據挖掘,制定精細的銷售策略,有效提高了企業收益。 · 相關性分組或關聯規則(Affinity grouping or association rules) 決定哪些事情將一起發生。 例子: a. 超市中客戶在購買A的同時,經常會購買B,即A => B(關聯規則) b. 客戶在購買A後,隔一段時間,會購買B (序列分析) · 聚集(Clustering) 聚集是對記錄分組,把相似的記錄在一個聚集里。聚集和分類的區別是聚集不依賴於預先定義好的類,不需要訓練集。 例子: a. 一些特定症狀的聚集可能預示了一個特定的疾病 b. 租VCD類型不相似的客戶聚集,可能暗示成員屬於不同的亞文化群 聚集通常作為數據挖掘的第一步。例如,"哪一種類的促銷對客戶響應最好?",對於這一 類問題,首先對整個客戶做聚集,將客戶分組在各自的聚集里,然後對每個不同的聚集,回答問題,可能效果更好。 c. 中國移動採用先進的數據挖掘工具馬克威分析系統,對用戶wap上網的行為進行聚類分析,通過客戶分群,進行精確營銷。
㈦ 數據挖掘的使用
分析方法:
· 分類 (Classification)
· 估計(Estimation)
· 預測(Prediction)
· 相關性分組或關聯規則(Affinity grouping or association rules)
· 聚類(Clustering)
· 復雜數據類型挖掘(Text, Web ,圖形圖像,視頻,音頻等)
方法簡介:
·分類 (Classification)
首先從數據中選出已經分好類的訓練集,在該訓練集上運用數據挖掘分類的技術,建立分類模型,對於沒有分類的數據進行分類。
例子:
a. 信用卡申請者,分類為低、中、高風險
b. 故障診斷:中國寶鋼集團與上海天律信息技術有限公司合作,採用數據挖掘技術對鋼材生產的全流程進行質量監控和分析,構建故障地圖,實時分析產品出現瑕疵的原因,有效提高了產品的優良率。
注意: 類的個數是確定的,預先定義好的
· 估計(Estimation)
估計與分類類似,不同之處在於,分類描述的是離散型變數的輸出,而估值處理連續值的輸出;分類的類別是確定數目的,估值的量是不確定的。
例子:
a. 根據購買模式,估計一個家庭的孩子個數
b. 根據購買模式,估計一個家庭的收入
c. 估計real estate的價值
一般來說,估值可以作為分類的前一步工作。給定一些輸入數據,通過估值,得到未知的連續變數的值,然後,根據預先設定的閾值,進行分類。例如:銀行對家庭貸款業務,運用估值,給各個客戶記分(Score 0~1)。然後,根據閾值,將貸款級別分類。
· 預測(Prediction)
通常,預測是通過分類或估值起作用的,也就是說,通過分類或估值得出模型,該模型用於對未知變數的預言。從這種意義上說,預言其實沒有必要分為一個單獨的類。預言其目的是對未來未知變數的預測,這種預測是需要時間來驗證的,即必須經過一定時間後,才知道預言准確性是多少。
· 相關性分組或關聯規則(Affinity grouping or association rules)
決定哪些事情將一起發生。
例子:
a. 超市中客戶在購買A的同時,經常會購買B,即A => B(關聯規則)
b. 客戶在購買A後,隔一段時間,會購買B (序列分析)
· 聚類(Clustering)
聚類是對記錄分組,把相似的記錄在一個聚集里。聚類和分類的區別是聚集不依賴於預先定義好的類,不需要訓練集。
例子:
a. 一些特定症狀的聚集可能預示了一個特定的疾病
b. 租VCD類型不相似的客戶聚集,可能暗示成員屬於不同的亞文化群
聚集通常作為數據挖掘的第一步。例如,哪一種類的促銷對客戶響應最好?,對於這一 類問題,首先對整個客戶做聚集,將客戶分組在各自的聚集里,然後對每個不同的聚集,回答問題,可能效果更好。
· 描述和可視化(Description and Visualization)
是對數據挖掘結果的表示方式。一般只是指數據可視化工具,包含報表工具和商業智能分析產品(BI)的統稱。譬如通過Yonghong Z-Suite等工具進行數據的展現,分析,鑽取,將數據挖掘的分析結果更形象,深刻的展現出來。