重新定位XLA应该比实现每个现有的TensorFlowOp用于新硬件更加简单和可扩展。 大多数实现将落入以下情况之一: 1.现有的CPU体系结构尚未正式由XLA支持,无论是否存在LLVM后端。
TensorFlow架构 我们为大规模分布式训练和推理设计了TensorFlow,但它也足够灵活,可以支持新机器学习模型和系统级优化的实验。 本文档描述了使这种规模和灵活性相结合的系统架构。
特别鼓励开发者针对新硬件加速器尝试XLA。 XLA框架是实验性和积极的开发。特别是,尽管现有操作的语义不太可能发生变化,但预计将增加更多的操作来涵盖重要的用例。
该指南分为几个部分: 一般最佳实践涵盖了各种模型类型和硬件中常见的主题。 针对与GPU有关的GPU细节提示进行优化。 针对CPU详细信息优化CPU特定信息。
属性 cpuR 此资源的CPU架构。 osR 该资源的操作系统。 公共类方法 新(cpu,os)显示源码 创建一个新的HINFO运行os上cpu。
VMwarevSphere 在VMwarevSphere虚拟基础架构上创建机器。该计算机必须安装有效的vSphereESXi。您可以使用付费许可证或60天免费试用许可证。
os.endianness() 用于返回CPU的字节序,可能的是"BE"或"LE"。 os.hostname() 用于返回操作系统的主机名。 os.type() 用于返回操作系统名。
分布式远程过程调用 频繁的CPU密集型操作并行化。 Storm组件 对于一个Storm集群,一个连续运行的主节点组织若干节点工作。
CPU到GPU数据传输:将图像从CPU传输到GPU。 每个阶段的主要部分与其他阶段并行执行data_flow_ops.StagingArea。
在多核系统上不存在任何约束时,当多个线程同时读取和写入多个变量时,一个线程可以按照与另一个线程写入它们的顺序不同的顺序观察值的变化。事实上,在多个读者线程中,更改的顺序甚至可能不同。
参数 file 字体文件格式目前是二进制和架构相关的。这意味着您应该在您运行PHP的计算机上在相同类型的CPU上生成字体文件。
--virtualbox-cpu-count用于创建VM的CPU数量。默认为单CPU。 --virtualbox-disk-size主机的磁盘大小(以MB为单位)。
模型架构 本CIFAR-10教程中的模型是一个由交替卷积和非线性组成的多层体系结构。这些层之后是完全连接的层,通向softmax分类器。
例如,考虑三个容器,一个cpu-share为1024,另外两个cpu-share设置为512.当所有三个容器中的进程尝试使用100%的CPU时,第一个容器将获得50%的CPU总CPU时间。

扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2026 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059
粤公网安备44030502008569号
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号
