1/* This is part of the netCDF package.
2   Copyright 2006 University Corporation for Atmospheric Research/Unidata.
3   See COPYRIGHT file for conditions of use.
4
5   This is a very simple example which writes a netCDF file with
6   Unicode names encoded with UTF-8.
7
8   $Id: tst_unicode.c,v 1.12 2008/10/20 01:48:08 ed Exp $
9*/
10#include <nc_tests.h>
11#include "err_macros.h"
12#include <stdlib.h>
13#include <stdio.h>
14#include <netcdf.h>
15
16/* The data file we will create. */
17#define FILE7_NAME "tst_unicode.nc"
18#define UNITS "units"
19#define NDIMS 1
20#define UTF8_BYTES 18
21
22int
23main(int argc, char **argv)
24{
25   int nciddimidvarid;
26   int dimids[NDIMS];
27
28   unsigned char name_utf8[] = {
29       0xCE, 0x9A,   /* GREEK CAPITAL LETTER KAPPA  : 2-bytes utf8 */
30       0xCE, 0xB1,   /* GREEK SMALL LETTER LAMBDA   : 2-bytes utf8 */
31       0xCE, 0xBB,   /* GREEK SMALL LETTER ALPHA    : 2-bytes utf8 */
32       0xCE, 0xB7,   /* GREEK SMALL LETTER ETA      : 2-bytes utf8 */
33       0xCE, 0xBC,   /* GREEK SMALL LETTER MU       : 2-bytes utf8 */
34       0xE1, 0xBD, 0xB3,  /* GREEK SMALL LETTER EPSILON
35                             WITH TONOS                  : 3-bytes utf8 */
36       0xCF, 0x81,   /* GREEK SMALL LETTER RHO      : 2-bytes utf8 */
37       0xCE, 0xB1, 0x00   /* GREEK SMALL LETTER ALPHA    : 2-bytes utf8 */
38   };
39
40/* Name used for dimension, variable, and attribute value */
41#define UNAME ((char *) name_utf8)
42#define UNAMELEN (sizeof name_utf8)
43
44   char name_in[UNAMELEN + 1], strings_in[UNAMELEN + 1];
45   nc_type att_type;
46   size_t att_len;
47
48   printf("\n*** Testing UTF-8.\n");
49   printf("*** creating UTF-8 test file %s...", FILE7_NAME);
50   if (nc_create(FILE7_NAMENC_NETCDF4, &ncid)) ERR;
51
52   /* Define dimension with Unicode UTF-8 encoded name */
53   if (nc_def_dim(ncidUNAMEUTF8_BYTES, &dimid)) ERR;
54   dimids[0] = dimid;
55
56   /* Define variable with same name */
57   if (nc_def_var(ncidUNAMENC_CHARNDIMSdimids, &varid)) ERR;
58
59   /* Create string attribute with same value */
60   if (nc_put_att_text(ncidvaridUNITSUNAMELENUNAME)) ERR;
61
62   if (nc_enddef(ncid)) ERR;
63
64   /* Write string data, UTF-8 encoded, to the file */
65   if (nc_put_var_text(ncidvaridUNAME)) ERR;
66
67   if (nc_close(ncid)) ERR;
68
69   /* Check it out. */
70
71   /* Reopen the file. */
72   if (nc_open(FILE7_NAMENC_NOWRITE, &ncid)) ERR;
73   if (nc_inq_varid(ncidUNAME, &varid)) ERR;
74   if (nc_inq_varname(ncidvaridname_in)) ERR;
75   {
76       /* Note, name was normalized before storing, so retrieved name
77   won't match original unnormalized name.  Check that we get
78   normalized version, instead.  */
79
80       /* NFC normalized UTF-8 for Unicode 8-character "Hello" in Greek */
81       unsigned char norm_utf8[] = {
82    0xCE, 0x9A,   /* GREEK CAPITAL LETTER KAPPA  : 2-bytes utf8 */
83    0xCE, 0xB1,   /* GREEK SMALL LETTER LAMBDA   : 2-bytes utf8 */
84    0xCE, 0xBB,   /* GREEK SMALL LETTER ALPHA    : 2-bytes utf8 */
85    0xCE, 0xB7,   /* GREEK SMALL LETTER ETA      : 2-bytes utf8 */
86    0xCE, 0xBC,   /* GREEK SMALL LETTER MU       : 2-bytes utf8 */
87    0xCE, 0xAD,    /* GREEK SMALL LETTER EPSILON WITH TONOS
88                                  : 2-bytes utf8 */
89    0xCF, 0x81,   /* GREEK SMALL LETTER RHO      : 2-bytes utf8 */
90    0xCE, 0xB1,   /* GREEK SMALL LETTER ALPHA    : 2-bytes utf8 */
91    0x00
92       };
93#define NNAME ((char *) norm_utf8)
94#define NNAMELEN (sizeof norm_utf8)
95       if (strncmp(NNAMEname_inNNAMELEN) != 0) ERR;
96   }
97   if (nc_inq_att(ncidvaridUNITS, &att_type, &att_len)) ERR;
98   if (att_type != NC_CHAR || att_len != UNAMELENERR;
99   if (nc_get_att_text(ncidvaridUNITSstrings_in)) ERR;
100   strings_in[att_len] = '\0'; /* null terminate, because nc_get_att_text doesn't */
101   if (strncmp(UNAMEstrings_inUNAMELEN) != 0) ERR;
102   if (nc_close(ncid)) ERR;
103
104   SUMMARIZE_ERR;
105   FINAL_RESULTS;
106}


HyperKWIC - Version 7.20DA executed at 11:37 on 27 Oct 2017 | Polyhedron Solutions - INTERNAL USE | COMMERCIAL (Any O/S) SN 4AKIed