- 1.2 基本概念
- 1.3 Galaxy Vision Service简介
- 1.3.1 集群地址
- 1.4 SDK
- 1.4.1 获取SDK
- 1.4.2 SDK发布和历史
- 1.5 快速开始
- 1.6 Galaxy Vision Service API
- 1.6.1 VisionClient
- 1.6.1.1 analysis_faces()
- 1.6.1.2 detect_labels()
- 1.6.1.3 match_faces()
- 1.6.1.4 Image
- 1.6.1.5 nlp_translation()
- 1.6.1.6 ocr_detection()
- 1.6.1.7 ocr_image_translation()
- 1.6.1.8 Label
- 1.6.1.9 OcrLine
- 1.6.1.10 OcrTranslateLine
- 1.6.1.11 OcrRegion
- 1.6.1.12 DetectLabelsParam
- 1.6.1.13 DetectFacesRequest
- 1.6.1.14 DetectLabelsRequest
- 1.6.1.15 FaceCompareRequest
- 1.7 FAQ
文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
1.2 基本概念
基本概念
人脸检测
人脸检测是指从一副静态的图像中检测并标记出人脸所在的区域, 并且给出表示人脸的矩形坐标(左上角坐标和右下角坐标, 其中图像左上角坐标是(0,0), 右下角坐标是(n,m), n,m分别为图像的像素宽度和高度)。在0.2, 0.3版的服务中增加了人脸的性别与年龄信息。
人脸检测有着广泛的用途, 比如(1): 智能驾驶辅助系统,能自动识别出道路前方的人脸, 并及时提醒驾驶人注意前方行人(2): 相机中添加人脸检测算法, 可以实时捕捉画面中人脸的位置并自动对焦。
人脸识别
人脸识别的前提是能够检测到人脸的存在,即人脸检测, 然后识别检测到的人脸是不是已知的某个人。这里面要用到人脸对比, 从各个角度多方问比对两个人脸的相似性。
人脸识别最典型的应用是刷脸支付,刷脸门禁。用户只需要向系统提供一些底片(用户本人脸部清晰照片),即可在下次通过刷脸完成支付,门禁等。
物体识别
给定一张静态图片,系统可以分析出照片中存在的物体, 因为准确率不能做到100%, 所以也会给出相应判断的的置信度。
自然语言机器翻译
机器翻译系统是支持翻译大量文本的在线服务,将文本从“源”语言译成另一种"目标"语言的过程。自从2010年代早期,新的人工智能技术- 深度神经网络(又称深度学习),已经使得翻译达到较高的精准度。现在支持7种语言的互相翻译
Ocr文本识别以及图片翻译
OCR(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成可搜索,可处理,可翻译的文本的服务。我们也提供直接从含有待翻译语言的图片直接翻译为含有位置坐标信息的目标语言的服务。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论