Swift 与机器学习：使用 Core ML 进行模型集成

Core ML 是苹果公司推出的机器学习框架，自 2017 年 6 月发布以来，一直致力于优化在移动设备上运行机器学习模型的性能。它为开发者提供了一套易于使用的 API，支持多种类型的机器学习模型，如神经网络、树集成、支持向量机和广义线性模型等。无论是处理图像、文本、音频还是其他数据类型，Core ML 都能提供高效的解决方案。通过本文的介绍，我们详细了解了如何使用 Swift 与 Core ML

算法探索者

1153人浏览 · 2025-04-05 04:31:46

算法探索者 · 2025-04-05 04:31:46 发布

引言

在当今数字化时代，机器学习已成为推动应用程序智能化发展的核心驱动力。从智能语音助手到图像识别应用，机器学习的身影无处不在，它能够让应用程序理解数据、识别模式并做出智能决策。在移动应用开发领域，苹果公司的 Core ML 框架为开发者提供了便捷且强大的工具，使得在 iOS、macOS、watchOS 和 tvOS 应用中集成机器学习模型变得触手可及。Swift 作为一种现代、高效且类型安全的编程语言，与 Core ML 框架完美结合，为开发者打造智能应用开辟了新的路径。本文将深入探讨如何使用 Swift 语言与 Core ML 框架进行机器学习模型的集成，通过实际案例和代码示例，帮助开发者掌握这一前沿技术，为应用程序赋予智能的力量。

理解 Core ML 框架

Core ML 简介

Core ML 的优势

设备端运行：Core ML 模型严格在用户设备上运行，无需网络连接。这不仅提升了应用程序的响应速度，还极大地保护了用户数据的隐私。例如，一款基于图像识别的健身应用，可以在用户手机上实时识别用户的运动姿势，而无需将用户的健身视频上传到云端。

性能优化：通过充分利用设备的 CPU、GPU 和神经网络引擎，Core ML 能够在最大程度减少内存占用和功耗的同时，实现卓越的模型性能。在处理复杂的图像分类任务时，Core ML 能够快速准确地给出分类结果，为用户带来流畅的使用体验。

广泛的模型支持：Core ML 支持从各种第三方训练库（如 TensorFlow、PyTorch 等）转换而来的模型，开发者可以使用自己熟悉的工具进行模型训练，然后轻松将其转换为 Core ML 支持的格式（.mlmodel）并集成到应用中。这为开发者提供了极大的灵活性，能够充分利用现有的机器学习资源。

与 Xcode 深度集成：Core ML 与 Xcode 紧密集成，开发者在编写代码之前，就可以在 Xcode 中探索模型的行为和性能。Xcode 会自动生成 Swift 和 Objective - C 接口，方便模型在应用中的集成。此外，还可以使用 Core ML 和神经引擎工具对应用中基于 Core ML 的功能进行分析和优化。

Core ML 的工作流程

模型获取：开发者可以使用 Create ML 工具在 Mac 上无代码构建和训练 Core ML 模型，也可以从第三方训练库（如 TensorFlow、PyTorch）训练模型后，使用 Core ML Tools 将其转换为 Core ML 模型格式（.mlmodel）。

模型集成：将获取到的.mlmodel 文件拖入 Xcode 项目中，Xcode 会自动生成相应的 Swift 或 Objective - C 接口，开发者通过这些接口在应用中加载和使用模型。

模型预测：在应用运行时，使用 Core ML API 将输入数据传递给模型，模型进行预测并返回结果，开发者根据模型的输出进行相应的处理。

使用 Swift 集成机器学习模型

加载和使用机器学习模型

导入必要的框架：在 Swift 项目中，首先需要导入 Core ML 框架，如果涉及到图像相关的处理，还需要导入 UIKit 和 Vision 框架。

import UIKit

import CoreML

import Vision

加载模型：假设我们有一个名为 “ImageClassifier” 的预训练图像分类模型，以下是加载该模型的代码示例：

class ViewController: UIViewController {

@IBOutlet weak var imageView: UIImageView!

@IBOutlet weak var resultLabel: UILabel!

let model: VNCoreMLModel = {

do {

let config = MLModelConfiguration()

let model = try VNCoreMLModel(for: ImageClassifier(configuration: config).model)

return model

} catch {

fatalError("Failed to load model: \(error)")

}

}()

在这段代码中，我们使用MLModelConfiguration配置模型，然后通过VNCoreMLModel的初始化方法加载ImageClassifier模型。如果模型加载失败，会通过fatalError抛出错误。

3. 使用模型进行预测：以图像分类为例，我们需要先将图像转换为模型能够处理的格式（如CVPixelBuffer），然后创建一个VNImageRequestHandler来处理图像请求。以下是完整的图像分类代码：

override func viewDidLoad() {

super.viewDidLoad()

// 加载并处理图像

guard let image = UIImage(named: "sampleImage") else { return }

classifyImage(image)

}

func classifyImage(_ image: UIImage) {

guard let pixelBuffer = image.pixelBuffer() else { return }

let request = VNCoreMLRequest(model: model) { (request, error) in

if let results = request.results as? [VNClassificationObservation] {

DispatchQueue.main.async {

self.resultLabel.text = results.first?.identifier

}

let handler = VNImageRequestHandler(ciImage: CIImage(image: image)!)

try? handler.perform([request])

}

在classifyImage方法中，我们首先通过image.pixelBuffer()方法将UIImage转换为CVPixelBuffer。然后创建一个VNCoreMLRequest，并指定模型和处理结果的闭包。在闭包中，我们将模型的分类结果更新到界面上的resultLabel中。最后，通过VNImageRequestHandler执行图像请求。

处理模型输出

不同类型模型的输出处理：不同类型的机器学习模型输出的结果形式不同。对于图像分类模型，输出通常是一系列的分类标签及其对应的置信度；对于自然语言处理模型，如情感分析模型，输出可能是文本的情感倾向（如积极、消极、中性）。

示例：自然语言模型处理文本：假设我们有一个用于情感分析的自然语言处理模型，以下是如何在 Swift 中处理文本数据并获取模型输出的示例：

import CoreML

import NaturalLanguage

class SentimentAnalyzer {

let model: NLModel = {

do {

return try NLModel(mlModel: SentimentClassifier().model)

} catch {

fatalError("Failed to load model: \(error)")

}

}()

func analyzeSentiment(of text: String) -> String? {

return model.predictedLabel(for: text)

}

在这个示例中，我们创建了一个SentimentAnalyzer类，在其初始化方法中加载了SentimentClassifier模型。analyzeSentiment方法接收一个字符串参数text，通过model.predictedLabel(for:)方法获取模型对该文本的情感分析结果并返回。

训练定制模型

Create ML 工具介绍：虽然 Core ML 在使用预训练模型方面表现出色，但开发者也可以使用 Create ML 工具创建定制模型。Create ML 是一个易于使用的工具，允许开发者通过图形界面训练定制模型。它支持多种任务，如图像分类、对象检测、文本分类、回归等。

使用 Create ML 训练模型的步骤：

- 准备数据：收集并整理用于训练模型的数据。例如，对于一个图像分类模型，需要准备不同类别的图像数据集，并进行标注。

- 打开 Create ML：在 Mac 上打开 Create ML 应用程序。

- 选择任务类型：根据需求选择合适的任务类型，如图像分类、文本分类等。

- 导入数据：将准备好的数据导入 Create ML 中。

- 训练模型：设置训练参数，开始训练模型。Create ML 会在训练过程中显示模型的性能指标。

- 评估和调整：训练完成后，对模型进行评估。如果模型性能不满意，可以调整数据或训练参数，重新训练。

- 导出模型：将训练好的模型导出为 Core ML 支持的.mlmodel 格式。

在 Swift 应用中集成定制模型：将使用 Create ML 训练好的.mlmodel 文件拖入 Xcode 项目中，与使用预训练模型一样，Xcode 会自动生成 Swift 接口。然后就可以按照加载和使用模型的步骤，在应用中使用定制模型进行预测。例如，假设我们训练了一个用于识别用户手写笔记内容的定制模型，在应用中加载该模型后，就可以对用户输入的手写笔记图像进行识别，将其转换为文本。

可视化模型预测

可视化的重要性：可视化模型预测结果可以帮助开发者更好地理解模型的性能和行为，也能为用户提供更直观的反馈。例如，在一个股票预测应用中，通过可视化模型预测的股票价格走势，用户可以更清晰地了解模型的预测结果。

使用图表库进行可视化：在 Swift 中，可以使用各种图表库来可视化模型输出。以 Charts 库为例，以下是一个简单的示例，展示如何使用它来显示图像分类模型的预测置信度：

import UIKit

import Charts

class ChartViewController: UIViewController {

@IBOutlet weak var barChartView: BarChartView!

func setupChart(with data: [String: Double]) {

var dataEntries: [BarChartDataEntry] = []

for (index, key) in data.keys.sorted().enumerated() {

let value = data[key]?? 0

let dataEntry = BarChartDataEntry(x: Double(index), y: value)

dataEntries.append(dataEntry)

}

let chartDataSet = BarChartDataSet(entries: dataEntries, label: "Predictions")

let chartData = BarChartData(dataSet: chartDataSet)

barChartView.data = chartData

}

在这个示例中，setupChart方法接收一个字典data，其中键是分类标签，值是对应的置信度。方法内部将数据转换为BarChartDataEntry数组，然后创建BarChartDataSet和BarChartData，最后将其设置为barChartView的数据，从而在界面上显示出柱状图，直观地展示模型的预测结果。

实际案例分析

图像识别应用

应用场景：开发一个智能相册应用，能够自动识别相册中的人物、风景、动物等类别，并进行分类整理。

模型选择与集成：使用一个预训练的图像分类模型，如 MobileNet，将其转换为 Core ML 格式并集成到 Swift 项目中。在应用启动时，加载模型：

let model: VNCoreMLModel = {

do {

let config = MLModelConfiguration()

let model = try VNCoreMLModel(for: MobileNet(configuration: config).model)

return model

} catch {

fatalError("Failed to load MobileNet model: \(error)")

}

}()

图像分类实现：遍历相册中的每张图片，将其转换为CVPixelBuffer后进行分类：

func classifyAlbumImages() {

let photoLibrary = PHPhotoLibrary.shared()

photoLibrary.performChanges({

// 获取相册中的所有图片

let fetchOptions = PHFetchOptions()

let allPhotos = PHAsset.fetchAssets(with: .image, options: fetchOptions)

allPhotos.enumerateObjects({ (asset, index, stop) in

let manager = PHImageManager.default()

let options = PHImageRequestOptions()

options.isSynchronous = true

manager.requestImage(for: asset, targetSize: CGSize(width: 224, height: 224), contentMode: .aspectFill, options: options) { (image, info) in

guard let image = image else { return }

guard let pixelBuffer = image.pixelBuffer() else { return }

let request = VNCoreMLRequest(model: self.model) { (request, error) in

if let results = request.results as? [VNClassificationObservation] {

let topResult = results.first

// 根据分类结果对图片进行分类整理，例如将人物图片移动到“人物”相册

if topResult?.identifier == "person" {

// 执行移动图片到“人物”相册的逻辑

}

let handler = VNImageRequestHandler(ciImage: CIImage(image: image)!)

try? handler.perform([request])

}

})

}) { (success, error) in

if success {

print("Image classification completed.")

} else {

print("Error during image classification: \(error?.localizedDescription ?? "")")

}

在这个案例中，通过 Core ML 和 Swift 的结合，实现了对相册中大量图片的快速分类，为用户提供了更智能、便捷的相册管理体验。

文本预测应用

应用场景：开发一个智能写作助手应用，能够根据用户输入的前几个单词，预测接下来可能输入的单词，提高用户的写作效率。

模型选择与集成：使用一个基于自然语言处理的语言模型，如 GPT - Neo 的 Core ML 版本（经过转换）。加载模型：

let languageModel: NLModel = {

do {

return try NLModel(mlModel: GPTNeoModel().model)

} catch {

fatalError("Failed to load GPT - Neo model: \(error)")

}

}()

文本预测实现：在用户输入文本的文本框的代理方法中，实时获取用户输入并进行预测：

extension ViewController: UITextFieldDelegate {

func textField(_ textField: UITextField, shouldChangeCharactersIn range: NSRange, replacementString string: String) -> Bool {

let currentText = (textField.text as NSString?)?.replacingCharacters(in: range, with: string)

if let prediction = languageModel.predictedLabel(for: currentText) {

// 在界面上显示预测的单词，例如在一个下拉列表中

showPrediction(prediction)

}

return true

}

在这个案例中，通过集成自然语言处理模型，为用户提供了实时的文本预测功能，大大提升了应用的智能化程度和用户体验。

总结与展望

通过本文的介绍，我们详细了解了如何使用 Swift 与 Core ML 框架进行机器学习模型的集成。从 Core ML 框架的基本概念、优势和工作流程，到使用 Swift 加载、使用、训练模型以及可视化模型输出，再通过实际案例展示了在图像识别和文本预测等领域的应用。Swift 的简洁高效和 Core ML 的强大功能相结合，为开发者提供了构建智能应用的有力工具。

随着技术的不断发展，机器学习在移动应用领域的应用将更加广泛和深入。未来，我们可以期待 Core ML 框架在性能优化、支持更多复杂模型以及与其他苹果技术的融合方面取得更大的突破。同时，Swift 语言也将不断演进，为开发者提供更便捷、高效的开发体验。开发者可以进一步探索如何利用 Core ML 和 Swift 实现更高级的功能，如实时视频分析、个性化推荐系统等，为用户带来更加智能、个性化的应用服务。

脑启社区

脑启社区是一个专注类脑智能领域的开发者社区。欢迎加入社区，共建类脑智能生态。社区为开发者提供了丰富的开源类脑工具软件、类脑算法模型及数据集、类脑知识库、类脑技术培训课程以及类脑应用案例等资源。

更多推荐

突破 Transformer 极限：一文看懂类脑架构 MT-LNN 最新的“超神”评测结果！

脑启社区

人工智能导论：模型与算法（未来发展与趋势）

人工智能作为引领新一轮科技革命和产业变革的战略性技术，正在深刻改变人类社会。本章从类脑计算、自动化机器学习、神经网络压缩、人工智能芯片、量子机器学习、人工智能伦理与治理、人工智能算法开发框架等方面，简要总结人工智能的未来发展方向和趋势。

脑启社区

CNSH通用翻译引擎 | 全语言互译+AI鉴定+来源追溯

《CNSH通用翻译引擎v1.0》摘要：该神经网络式翻译系统采用类脑架构设计，核心包含智能路由中枢（决策前额叶）和模块神经网络。具备多语言互译、AI伪代码识别、代码溯源三大功能，支持动态路径调整和双向反馈学习。系统通过特征感知、智能路由、并行处理实现高效翻译，并采用DNA追溯和三色审计确保可靠性。相比传统流水线架构，新设计具有神经网络的自适应优势，各模块可互相激活协作，实现更接近人类思维的翻译过程。