博客
关于我
关于Java中的getBytes()的原理理解以及演算
阅读量:161 次
发布时间:2019-02-27

本文共 679 字,大约阅读时间需要 2 分钟。

当你调用String.getBytes()时,Java会根据字符串的内容和指定的编码方式将每个字符转换为相应的字节。具体过程如下:

  • Java String的内部表示:Java String使用UTF-16编码存储字符,这意味着每个字符可能由1或2个16-bit值组成(即2或4个字节)。

  • 编码方式的选择String.getBytes()默认使用平台默认编码(通常是UTF-8),但可以指定其他编码方式。

  • 转换过程

    • 遍历字符串中的每个字符。
    • 对于每个字符,根据编码方式将其转换为字节。
    • 不同编码方式会影响结果,例如UTF-8处理字符的方式与ISO-8859-1不同。
  • 示例分析:以字符串“abcD热爱技术”为例:

    • 'a' -> 97
    • 'b' -> 98
    • 'c' -> 99
    • 'D' -> 68
    • '热' -> 在UTF-8中为0xEF 0xBF 0xBD
    • '爱' -> 0xE4 0xA4 0xB5
    • '技术' -> 0xE7 0xA8 0xA2
    • 继续类推,直到所有字符转换完成。
  • 不同编码方式的影响:使用不同的编码方式会导致字节数组的不同。例如,使用ISO-8859-1可能会有不同的结果,而UTF-8则能更准确地表示所有字符。

  • 手动演算示例

    String str = "abcD热爱技术";byte[] bytes = str.getBytes("UTF-8");// bytes数组将包含上述每个字符转换后的字节

    这段代码将生成一个字节数组,包含所有字符转换后的结果。

  • 通过以上步骤,你可以理解字符串转换为字节数组的原理,并根据需要选择合适的编码方式。

    转载地址:http://autb.baihongyu.com/

    你可能感兴趣的文章
    PATA1038题解(需复习)
    查看>>
    Path does not chain with any of the trust anchors
    查看>>
    Path形状获取字符串型变量数据
    查看>>
    PAT甲级——1001 A+B Format (20分)
    查看>>
    PAT甲级——1006 Sign In and Sign Out (25分)
    查看>>
    PAT甲级——1007 Maximum Subsequence Sum (25分)
    查看>>
    PAT甲级——1009 Product of Polynomials (25分)(最后一个测试点段错误)
    查看>>
    PayPal网站付款标准版(for PHP)
    查看>>
    Paystack Android SDK 集成与使用指南
    查看>>
    pbf格式详解,javascript加载导出pbf文件示例
    查看>>
    PbootCMS entrance.php SQL注入漏洞复现
    查看>>
    PbootCMS 前台RCE漏洞复现
    查看>>
    PBT
    查看>>
    PCA---主成成分分析
    查看>>
    PCA降维demo
    查看>>
    SharePoint 2013 图文开发系列之定义站点模板
    查看>>
    PCI Express学习篇:Power Management(二)
    查看>>
    pcie握手机制_【博文连载】PCIe扫盲——Ack/Nak 机制详解(一)
    查看>>
    PC史上最悲剧的16次失败
    查看>>
    PC端恶意代码分析Lab1.1-5.1,从零基础到精通,收藏这篇就够了!
    查看>>