溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Java如何實(shí)現(xiàn)的k-means聚類算法

發(fā)布時(shí)間:2021-04-17 14:21:03 來(lái)源:億速云 閱讀:377 作者:小新 欄目:編程語(yǔ)言

小編給大家分享一下Java如何實(shí)現(xiàn)的k-means聚類算法,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

需求

對(duì)MySQL數(shù)據(jù)庫(kù)中某個(gè)表的某個(gè)字段執(zhí)行k-means算法,將處理后的數(shù)據(jù)寫(xiě)入新表中。

源碼及驅(qū)動(dòng)

kmeans_jb51.rar

源碼

import java.sql.*;
import java.util.*;

/**
 * @author tianshl
 * @version 2018/1/13 上午11:13
 */
public class Kmeans {
  // 源數(shù)據(jù)
  private List<Integer> origins = new ArrayList<>();

  // 分組數(shù)據(jù)
  private Map<Double, List<Integer>> grouped;

  // 初始質(zhì)心列表
  private List<Double> cores;

  // 數(shù)據(jù)源
  private String tableName;
  private String colName;

  /**
   * 構(gòu)造方法
   *
   * @param tableName 源數(shù)據(jù)表名稱
   * @param colName  源數(shù)據(jù)列名稱
   * @param cores   質(zhì)心列表
   */
  private Kmeans(String tableName, String colName,List<Double> cores){
    this.cores = cores;
    this.tableName = tableName;
    this.colName = colName;
  }

  /**
   * 重新計(jì)算質(zhì)心
   *
   * @return 新的質(zhì)心列表
   */
  private List<Double> newCores(){
    List<Double> newCores = new ArrayList<>();

    for(List<Integer> v: grouped.values()){
      newCores.add(v.stream().reduce(0, (sum, num) -> sum + num) / (v.size() + 0.0));
    }

    Collections.sort(newCores);
    return newCores;
  }

  /**
   * 判斷是否結(jié)束
   *
   * @return bool
   */
  private Boolean isOver(){
    List<Double> _cores = newCores();
    for(int i=0, len=cores.size(); i<len; i++){
      if(!cores.get(i).toString().equals(_cores.get(i).toString())){
        // 使用新質(zhì)心
        cores = _cores;
        return false;
      }
    }
    return true;
  }

  /**
   * 數(shù)據(jù)分組
   */
  private void setGrouped(){
    grouped = new HashMap<>();

    Double core;
    for (Integer origin: origins) {
      core = getCore(origin);

      if (!grouped.containsKey(core)) {
        grouped.put(core, new ArrayList<>());
      }

      grouped.get(core).add(origin);
    }
  }

  /**
   * 選擇質(zhì)心
   *
   * @param num  要分組的數(shù)據(jù)
   * @return   質(zhì)心
   */
  private Double getCore(Integer num){

    // 差 列表
    List<Double> diffs = new ArrayList<>();

    // 計(jì)算差
    for(Double core: cores){
      diffs.add(Math.abs(num - core));
    }

    // 最小差 -> 索引 -> 對(duì)應(yīng)的質(zhì)心
    return cores.get(diffs.indexOf(Collections.min(diffs)));
  }

  /**
   * 建立數(shù)據(jù)庫(kù)連接
   * @return connection
   */
  private Connection getConn(){
    try {
      // URL指向要訪問(wèn)的數(shù)據(jù)庫(kù)名mydata
      String url = "jdbc:mysql://localhost:3306/data_analysis_dev";
      // MySQL配置時(shí)的用戶名
      String user = "root";
      // MySQL配置時(shí)的密碼
      String password = "root";

      // 加載驅(qū)動(dòng)
      Class.forName("com.mysql.jdbc.Driver");

      //聲明Connection對(duì)象
      Connection conn = DriverManager.getConnection(url, user, password);

      if(conn.isClosed()){
        System.out.println("連接數(shù)據(jù)庫(kù)失敗!");
        return null;
      }
      System.out.println("連接數(shù)據(jù)庫(kù)成功!");

      return conn;

    } catch (Exception e) {
      System.out.println("連接數(shù)據(jù)庫(kù)失敗!");
      e.printStackTrace();
    }

    return null;
  }

  /**
   * 關(guān)閉數(shù)據(jù)庫(kù)連接
   *
   * @param conn 連接
   */
  private void close(Connection conn){
    try {
      if(conn != null && !conn.isClosed()) conn.close();
    } catch (Exception e){
      e.printStackTrace();
    }
  }

  /**
   * 獲取源數(shù)據(jù)
   */
  private void getOrigins(){

    Connection conn = null;
    try {
      conn = getConn();
      if(conn == null) return;

      Statement statement = conn.createStatement();

      ResultSet rs = statement.executeQuery(String.format("select %s from %s", colName, tableName));

      while(rs.next()){
        origins.add(rs.getInt(1));
      }
      conn.close();
    } catch (Exception e){
      e.printStackTrace();
    } finally {
     close(conn);
    }
  }

  /**
   * 向新表中寫(xiě)數(shù)據(jù)
   */
  private void write(){

    Connection conn = null;
    try {
      conn = getConn();
      if(conn == null) return;
      
      // 創(chuàng)建表
      Statement statement = conn.createStatement();

      // 刪除舊數(shù)據(jù)表
      statement.execute("DROP TABLE IF EXISTS k_means; ");
      // 創(chuàng)建新表
      statement.execute("CREATE TABLE IF NOT EXISTS k_means(`core` DECIMAL(11, 7), `col` INTEGER(11));");

      // 禁止自動(dòng)提交
      conn.setAutoCommit(false);

      PreparedStatement ps = conn.prepareStatement("INSERT INTO k_means VALUES (?, ?)");

      for(Map.Entry<Double, List<Integer>> entry: grouped.entrySet()){
        Double core = entry.getKey();
        for(Integer value: entry.getValue()){
          ps.setDouble(1, core);
          ps.setInt(2, value);
          ps.addBatch();
        }
      }

      // 批量執(zhí)行
      ps.executeBatch();

      // 提交事務(wù)
      conn.commit();

      // 關(guān)閉連接
      conn.close();
    } catch (Exception e){
      e.printStackTrace();
    } finally {
      close(conn);
    }
  }

  /**
   * 處理數(shù)據(jù)
   */
  private void run(){
    System.out.println("獲取源數(shù)據(jù)");
    // 獲取源數(shù)據(jù)
    getOrigins();

    // 停止分組
    Boolean isOver = false;

    System.out.println("數(shù)據(jù)分組處理");
    while(!isOver) {
      // 數(shù)據(jù)分組
      setGrouped();
      // 判斷是否停止分組
      isOver = isOver();
    }

    System.out.println("將處理好的數(shù)據(jù)寫(xiě)入數(shù)據(jù)庫(kù)");
    // 將分組數(shù)據(jù)寫(xiě)入新表
    write();

    System.out.println("寫(xiě)數(shù)據(jù)完畢");
  }

  public static void main(String[] args){
    List<Double> cores = new ArrayList<>();
    cores.add(260.0);
    cores.add(600.0);
    // 表名, 列名, 質(zhì)心列表
    new Kmeans("attributes", "attr_length", cores).run();
  }
}

源文件

Kmeans.java

編譯

javac Kmeans.java

運(yùn)行

# 指定依賴庫(kù)
java -Djava.ext.dirs=./lib Kmeans

以上是“Java如何實(shí)現(xiàn)的k-means聚類算法”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI